tôi đã này khác nhau cùng một vấn đề (một tấm gương wget
với ký tự đặc biệt và dấu ngoặc kép được hiển thị dưới dạng Unicode "char chưa biết", ?
) khi duyệt qua gương.
Sự cố được chuyển sang liên quan đến các mã hóa máy chủ khác nhau, thay vì tùy thuộc vào wget
. Máy chủ gốc là một cài đặt Windows + IIS cũ được cấu hình để phục vụ các trang HTML với mã hóa ISO-8859, trong khi máy nhân bản là một máy chủ Linux + Apache được cấu hình để phục vụ các trang UTF-8.
Giải pháp là để cấu hình Apache để phục vụ các trang tiêu chuẩn ISO-8859, thêm vào các máy chủ ảo đúng chỉ thị AddDefaultCharset ISO-8859-1
How are you kiểm tra các tập tin kết quả? Có khả năng là tệp có mã hóa UTF-8 và bạn cần kiểm tra chúng trong trình chỉnh sửa hoặc trình duyệt web hiểu rằng chúng là UTF-8. –
@Brett Bạn giải quyết vấn đề này như thế nào? – SJU
@AngelTsankov, đã lâu rồi, nhưng tôi không nghĩ mình đã từng tìm được giải pháp. – Brett