Đây là vấn đề của tôi, tôi có một biến mã hóa sai mà tôi muốn sửa chữa. câu chuyện dài ngắn, tôi kết thúc với:mã hóa python chuyển đổi
myVar=u'\xc3\xa9'
đó là sai bởi vì đó là nhân vật 'é' hoặc \u00e9
UTF-8 mã hóa, không unicode.
Không có sự kết hợp mã hóa/giải mã nào mà tôi cố gắng giải quyết vấn đề. Tôi nhìn về phía đối tượng bị cắt xén, nhưng bạn phải cung cấp một mã hóa, và rõ ràng là không ai trong số họ phù hợp.
Về cơ bản tôi cần diễn giải lại mảng byte thành mã hóa chính xác. Bất kỳ ý tưởng về cách làm điều đó? Cảm ơn.
UTF-8 là unicode. –
Bạn muốn kết thúc bằng gì, unicode hoặc str? – pajton
@ X-Istence: nope unicode là * số * đứng cho một ký tự, trong khi UTF-8 là * mã hóa * cho số đó (chẳng hạn như UTF-16, UTF-32 ...) – gregseth