Vì vậy, tôi gặp một số vấn đề với mã hóa ký tự. Khi tôi đặt hai nhân vật sau đây vào một UTF32 mã hóa tập tin văn bản:
鸕
và sau đó chạy đoạn mã này vào chúng: System.IO.StreamReader streamReader =
utf16 hoặc utf32? Tôi đang cố gắng lưu trữ nội dung bằng nhiều ngôn ngữ. Một số ngôn ngữ sử dụng phông chữ đôi (ví dụ: phông chữ tiếng Nhật thường gấp hai lần phông chữ tiếng Anh). Tôi không chắc tôi
thể trùng lặp: Why UTF-32 exists whereas only 21 bits are necessary to encode every character? Các điểm mã Unicode tối đa là 0x10FFFF trong UTF-32. UTF-32 có 21 bit thông tin và 11 bit trống thừa. Vậy
Thư viện C hoặc C++ nguồn mở nào có thể chuyển đổi UTF-32 tùy ý thành NFC? Thư viện mà tôi nghĩ có thể làm điều này cho đến nay: ICU, Qt, GLib (không chắc chắn?). Tôi không cần bất kỳ hỗ trợ Unicode p