tôi có một loạt các nhân vật với điều đó trông giống như sau:Java chuyển đổi dòng nhân vật thành con người "có thể đọc được" Chuỗi
Комуникационна кабелна система
và đôi khi tôi có một kết hợp như thế này:
Généralités
Các đầu tiên chuyển thành:
К о м у н и к а ц и о н н а к а б е л н а с и с т е м а
và thứ hai tới:
G é n é ralit é s
tôi có thể thấy điều này sử dụng một trình duyệt và đặt chúng vào cơ thể.
Nhưng làm thế nào tôi có thể làm cho java xuất ra các ký tự "thực"? Mã hóa ở trên được gọi là gì?
Tôi đã thử một vài điều, và cuối cùng này (mà không làm việc):
import java.nio.charset.*;
import java.nio.ByteBuffer;
import java.nio.CharBuffer;
List<String> lst = new ArrayList<String>(); lst.add("К"); lst.add("о");
for (String s : lst) {
Charset utf8charset = Charset.forName("UTF-8");
Charset iso88591charset = Charset.forName("ISO-8859-1");
ByteBuffer inputBuffer = ByteBuffer.wrap(s.getBytes());
// decode UTF-8
CharBuffer data = utf8charset.decode(inputBuffer);
// encode ISO-8559-1
ByteBuffer outputBuffer = iso88591charset.encode(data);
byte[] outputData = outputBuffer.array();
System.out.println (new String(outputData))
}
Đó là HTML được thoát. –
chúng được gọi là thực thể. nếu bạn tìm kiếm chuyển đổi từ thực thể sang unicode, bạn có thể tìm thấy những gì bạn đang tìm kiếm theo cách đó – dldnh
@dldnh cảm ơn bạn đã làm rõ! không phải là điều dễ nhất để tìm kiếm trên web cho :) – momomo