Có một tiêu chuẩn, tốt nhất là Pythonic, cách để chuyển đổi ký hiệu &#xxxx;
thành chuỗi unicode thích hợp không?Chuyển đổi ký hiệu tham chiếu ký tự số thành chuỗi unicode
Ví dụ,
מפגשי
nên được chuyển đổi sang:
מפגשי
Nó có thể được thực hiện - khá dễ dàng - sử dụng thao tác chuỗi, nhưng tôi tự hỏi, nếu có một thư viện chuẩn cho việc này.
Gợi ý: đó là ký hiệu được gọi là [ "tài liệu tham khảo nhân vật số"] (https: // en. wikipedia.org/wiki/Numeric_character_reference). –
+1 @JoachimSauer, cảm ơn, đã cập nhật tiêu đề. –
Liên quan: http://stackoverflow.com/questions/3894564/replace-numeric-character-references-in-xml-document-using-python –