Tôi đã xem xét tất cả các xung quanh và chỉ tìm thấy giải pháp cho python 2.6 và trước đó, NOTHING về cách làm điều này trong python 3.X. (Tôi chỉ có quyền truy cập vào hộp Win7.)Làm thế nào để các thực thể HTML unescape trong một chuỗi trong Python 3.1?
Tôi CÓ thể thực hiện việc này trong 3.1 và tốt hơn là không có thư viện bên ngoài. Hiện tại, tôi đã cài đặt và truy cập httplib2 vào lệnh curl (đó là cách tôi nhận được mã nguồn cho các trang). Thật không may, curl không giải mã các thực thể html, theo như tôi biết, tôi không thể tìm thấy một lệnh để giải mã nó trong tài liệu.
CÓ, tôi đã cố gắng để có được Súp đẹp hoạt động, NHIỀU GIỜ mà không thành công trong 3.X. Nếu bạn có thể cung cấp hướng dẫn EXPLICIT về cách làm cho nó hoạt động trong python 3 trong môi trường MS Windows, tôi sẽ rất biết ơn.
Vì vậy, để rõ ràng, tôi cần phải bật các chuỗi như sau: Suzy & John
thành chuỗi như sau: "Suzy & John".
Tuyệt vời! Tuy nhiên, tôi thấy rằng chỉ unescapes ký tự nhất định. Ví dụ: dấu và ký tự vẫn được thoát. Bạn có thể giải thích tại sao điều này? Làm thế nào để tôi unescape các ký tự? –
@Sho Minamimoto: Tôi đã thêm một ví dụ. Hy vọng nó giúp? – unutbu
Vâng, tôi hiểu rồi, cảm ơn! –