Có cách nào để kiểm tra là tệp văn bản (.txt) được mã hóa bằng Unicode hoặc UTF-8 với Java không?Có cách nào để kiểm tra mã hóa charset của tệp .txt với Java không?
7
A
Trả lời
10
Bạn không thể biết chắc chắn rằng bộ ký tự nào được sử dụng trong trường hợp chung. Tôi thấy điều này là một đọc tốt.
http://illegalargumentexception.blogspot.co.uk/2009/05/java-rough-guide-to-character-encoding.html
Đặc biệt phần Tự động phát hiện mã hóa.
2
Uhm, về mặt lý thuyết, làm cách nào bạn biết nếu đó là unicode?
Đây là câu hỏi thực sự. Thật sự, bạn không thể biết được, nhưng bạn có thể đoán đúng.
Xem: Java : How to determine the correct charset encoding of a stream để biết thêm chi tiết. :)