Tôi tìm kiếm và xử lý các tệp XML từ nơi khác và cần phải chuyển đổi chúng bằng một số XSLT. Không vấn đề gì. Sử dụng thư viện PHP5 và thư viện DOM , mọi thứ đều nhanh chóng. Làm việc tốt, cho đến bây giờ. Hôm nay, funky ký tự nằm trong tệp XML - "thông minh" trích dẫn từ Word, có vẻ như thích. Dù sao, DOMDocument-> tải phàn nàn về họ, nói rằng họ không phải là UTF-8, và để xác định mã hóa.Làm cách nào để tôi biết DOMDocument-> load() mã hóa nào tôi muốn sử dụng?
Lo và xem, mã hóa không được chỉ định trong các tệp XML này. Nếu tôi thêm vào 'encoding = "iso-8859-1"' vào tiêu đề, nó hoạt động tốt. Chà là Tôi không kiểm soát được các tệp XML này.
Đọc tệp thành chuỗi, sửa đổi tiêu đề và viết lại vào vị trí khác có vẻ là lựa chọn duy nhất của tôi, nhưng tôi muốn làm mà không phải sử dụng bản sao tạm thời của tệp XML tại tất cả các. Có phải có cách nào đơn giản để nói cho trình phân tích cú pháp phân tích cú pháp chúng như thể chúng là iso-8859-1 không?
Cố gắng này - nó dường như không ảnh hưởng đến các tài liệu được nạp - từ đọc sách của tôi, tôi 'm khá chắc chắn mã hóa được thiết lập lại bởi tải() gọi – Loki