Cách tối ưu để loại bỏ dấu trọng âm của Đức (hoặc tiếng Pháp) khỏi vec tơ 16 triệu biến chuỗi.Chuyển đổi các ký tự có dấu trọng âm thành ký tự ascii
ví dụ: 'hội chứng Sjogren' thành 'Sjogren hội chứng'
converstion của nhân vật duy nhất vào một nhân vật duy nhất là tốt hơn sau đó phiên âm như
ä => ae ö => oe ü => ue.
ví dụ: sử dụng cụm từ thông dụng sẽ là một tùy chọn nhưng có cái gì tốt hơn (gói R cho điều này) không?
gsub('ü','u',gsub('ö','o',"Sjögren's syndrome (über) "))
Có SO giải pháp cho nền tảng không-R nhưng không phải là một trong những tốt cho R.
Xem câu trả lời cho thi s bài: [stackoverflow.com/questions/23699271/force-character-vector-encoding-from-unknown-to-utf-8-in-r][1] [1]: http://stackoverflow.com/questions/23699271/force-character-vector-encoding-from-unknown-to-utf-8-in-r –
Xem câu trả lời cho bài đăng này: [http://stackoverflow.com/questions/23699271/force-character-vector-encoding-từ-unknown-to-utf-8-in-r] [1] [1]: http://stackoverflow.com/questions/23699271/force- character-vector-encoding-from-unknown-to-utf-8-in-r –