Nếu không có tham số charset được quy định trong tiêu đề Content-Type, RFC2616 section 3.7.1 dường như ngụ ý iso8859-1 nên được giả định đối với các loại phương tiện truyền thông của kiểu phụ "text":Đối với phản hồi HTTP với Loại nội dung đề xuất dữ liệu ký tự, bộ ký tự nào phải được trình khách giả định nếu không có chỉ định nào được chỉ định?
Khi không có tham số charset rõ ràng là được cung cấp bởi người gửi, loại phương tiện truyền thông loại "văn bản" được xác định là có giá trị mặc định của ký tự là "ISO-8859-1" khi nhận được qua HTTP.
Dữ liệu trong bộ ký tự khác với "ISO-8859-1" hoặc tập hợp con của nó PHẢI là được gắn nhãn bằng bộ ký tự thích hợp giá trị.
Tuy nhiên, tôi thường thấy các ứng dụng phân phối các tệp Javascript có các giá trị Loại nội dung như "application/x-javascript" (tức là không có thông số charset), ngay cả khi các tập lệnh này chứa ký tự UTF-8 không phải ASCII sẽ bị hỏng nếu được hiểu là ISO8859-1.
Điều này dường như không gây ra sự cố cho khách hàng. Làm thế nào để khách hàng biết để giải thích các byte như UTF-8? Có quy tắc nào cho các loại phụ dữ liệu ký tự khác ngụ ý UTF-8 phải là mặc định không? Tài liệu này ở đâu?
Đồng ý - do đó, câu hỏi là: Có quy tắc cho các loại dữ liệu ký tự không phải là "văn bản" không? Nếu vậy, tài liệu này ở đâu? – rewbs
Không có quy tắc chung, vì loại phương tiện có thể không phải là ký tự ở vị trí đầu tiên ... –
Câu hỏi này đặc biệt về các loại phương tiện đề xuất dữ liệu ký tự. Nếu không có quy tắc chung, có quy tắc cụ thể cho các loại phương tiện khác nhau không? Họ được ghi chép ở đâu? Phải có ít nhất * một số * quy tắc, do khách hàng phải đưa ra quyết định về cách diễn giải byte. – rewbs