2013-04-17 9 views
6

Tôi có chuỗi unicode, tôi chắc chắn rằng đó là UTF-8, nhưng tôi không thể giải mã nó. Chuỗi là '\u041b\u0435\u0433\u043a\u043e\u0432\u044b\u0435'. Làm thế nào để giải mã nó?Giải mã Python " u041b" chuỗi

+1

giải mã những gì - làm thế nào để bạn muốn sử dụng nó? – Mark

+0

Ồ, tôi câm :) in u '\ u0441 \ u0438 \ u0434 \ u0435 \ u043d \ u044c \ u044f' cung cấp chuỗi thông thường có thể đọc được. – arts777

+0

Nó chắc chắn không phải là UTF8. – glglgl

Trả lời

24

Bạn có thể sử dụng aString.decode('unicode_escape'), nó chuyển đổi một chuỗi unicode định dạng cho đối tượng unicode

>>> u'\u041b\u0435\u0433\u043a\u043e\u0432\u044b\u0435' 
u'\u041b\u0435\u0433\u043a\u043e\u0432\u044b\u0435' 
>>> '\u041b\u0435\u0433\u043a\u043e\u0432\u044b\u0435'.decode('unicode_escape') 
u'\u041b\u0435\u0433\u043a\u043e\u0432\u044b\u0435' 
>>> 

Trong trường hợp của bạn

>>> print '\u041b\u0435\u0433\u043a\u043e\u0432\u044b\u0435'.decode('unicode_escape') 
Легковые 
>>>