Khi dán văn bản từ các nguồn bên ngoài vào một trình soạn thảo văn bản thuần túy (ví dụ: TextMate hoặc Văn bản siêu việt 2), một vấn đề thường gặp là các ký tự đặc biệt thường được dán vào. Một số ký tự này hiển thị tốt, nhưng tùy thuộc vào nguồn, một số có thể không hiển thị chính xác (thường hiển thị dưới dạng dấu hỏi với một hộp xung quanh nó).Làm cách nào để tìm mã ký tự của một ký tự đặc biệt trong trình soạn thảo văn bản?
Vì vậy, đây thực sự là 2 câu hỏi:
Cho một kí tự đặc biệt (ví dụ, 'hoặc ♥) Tôi có thể xác định UTF-8 mã ký tự dùng để hiển thị rằng nhân vật từ bên trong soạn thảo văn bản của tôi, và/hoặc chuyển đổi các ký tự đó thành mã ký tự của chúng?
Đối với những ký tự "đặc biệt" có trong thùng rác, có cách nào để tìm ra cách mã hóa được sử dụng để hiển thị ký tự đó trong văn bản nguồn và các ký tự đó có thể được chuyển đổi thành UTF-8 ?
Bạn có thể sử dụng [công cụ trực tuyến] này (https://www.soscisurvey.de/tools/view-chars.php) để dán các chuỗi có ký tự không xác định và xem số unicode của chúng. – BurninLeo
Là một trợ giúp cơ bản, tôi đã tạo ra một bảng của tất cả các mã ký tự trong phạm vi 0x80-0xFF trong mã hóa 8 bit kế thừa được biết đến với Python, mà tôi thường xuyên tham khảo: https://cdn.rawgit.com/tripleee /8bit/master/encodings.html – tripleee