2011-09-20 11 views

Trả lời

19

bạn có thể sử dụng iconv:

writeLines(iconv(readLines("tmp.html"), from = "ANSI_X3.4-1986", to = "UTF8"), "tmp2.html") 

tmp2.html nên utf-8.


Sửa bởi Henrik trong tháng Sáu 2015:
Một giải pháp làm việc cho Windows chưng cất từ ​​những ý kiến ​​như sau:

writeLines(iconv(readLines("tmp.html"), from = "ANSI_X3.4-1986", to = "UTF8"), 
      file("tmp2.html", encoding="UTF-8")) 
+0

Nhưng những gì với tiêu đề html? Không nên thay đổi? – Marek

+0

Cảm ơn Kohske, nhưng điều này không hiệu quả với tôi. Nó sẽ chuyển đổi văn bản trong tập tin, nhưng theo một cách kỳ lạ, không phải tập tin. Khi tôi sử dụng notepad ++ để xem mã hóa, nó vẫn là ANSI, và chỉ thông qua notepad ++ tôi mới có thể thay đổi nó thành UTF8 (mã của bạn sẽ không làm điều đó). Bất kỳ đề xuất? :) –

+2

Làm thế nào về việc thay đổi 'từ =" CP1252 "? – kohske