Tôi có danh sách chứa các URL có ký tự thoát trong chúng. Những nhân vật đã được thiết lập bởi urllib2.urlopen
khi nó phục hồi trang html:Giải mã các ký tự thoát trong URL
http://www.sample1webpage.com/index.php?title=%E9%A6%96%E9%A1%B5&action=edit
http://www.sample1webpage.com/index.php?title=%E9%A6%96%E9%A1%B5&action=history
http://www.sample1webpage.com/index.php?title=%E9%A6%96%E9%A1%B5&variant=zh
Có cách nào để chuyển đổi chúng trở lại hình thức unescaped của họ trong python?
P.S .: Các URL được mã hóa trong utf-8
các chương trình unquote như tôi đã nói ở trên sample.com/index.php?title=\xe9\xa6\x96\xe9\xa1 \ xb5 & action = edi ... có lẽ tôi đã không giải thích bản thân mình rất tốt trong trường hợp này ... nhưng url là một người Trung Quốc và tôi muốn giải mã nó là char gốc, không phải là unquote – dyoser
@dyoser Bạn cần phải đặt trong câu hỏi của bạn. –
@ root45 đây là một bình luận cho một câu trả lời ... vì vậy nó rất tốt ở đây. Cảm ơn sự đánh giá cao của bạn. – dyoser