utf-8

5Nhiệt

1Trả lời

Làm thế nào để giao dịch SWIG với chuỗi utf8 trong C#?

Tôi đang viết một thư viện C++ di động với các ràng buộc với các ngôn ngữ khác (java, C#, python). Tôi đang thực hiện những ràng buộc đó với sự giúp đỡ của SWIG. Tôi có một lớp học viết bằng C++: clas

8Nhiệt

1Trả lời

Bảng mã trong dữ liệu URI

Qua nhiều năm từ việc đọc các thông số kỹ thuật phát triển, tôi đã giả định rằng RFC 3986 cuối cùng đã được giải quyết trên mã hóa UTF-8 cho chuỗi octet thoát. Nghĩa là, nếu URI của tôi có %XX%YY%ZZ,

23Nhiệt

2Trả lời

application/x-www-form-urlencoded và charset = "utf-8"?

Thông thường có bỏ qua ;charset="utf-8" khi loại Nội dung là application/x-www-form-urlencoded không? Cụ thể, khi sử dụng accept-charset="utf-8" trong thẻ biểu mẫu, tôi mong đợi một số dấu hiệu cho bi

20Nhiệt

3Trả lời

Không thể đọc unicode .csv vào R

Tôi có một tập tin .csv, trong đó có chứa các dữ liệu sau: "Ա","Բ" 1,10 2,20 tôi không thể đọc nó vào R để các tên cột được hiển thị như họ đang có trong tập tin. d <- read.csv("./Data/1.csv", fil

7Nhiệt

2Trả lời

Đọc một dòng tệp theo dòng VB.NET

Mã sau được sử dụng để đọc từng dòng tệp. Đây chỉ là phiên bản rất sớm, vì vậy tất cả những gì tôi muốn làm là hiển thị chuỗi trong cửa sổ ngay lập tức. Nó hoạt động tốt, ngoại trừ những nhân vật như

8Nhiệt

2Trả lời

Làm cách nào để ghi lại các lỗi giải mã utf-8 trong node.js?

Tôi vừa phát hiện ra rằng Node (được kiểm tra: v0.8.23, git hiện tại: v0.11.3-pre) ignores any decoding errors trong việc xử lý Bộ đệm, âm thầm thay thế bất kỳ ký tự không phải utf8 nào bằng '\ufffd'

40Nhiệt

3Trả lời

Cách chuyển đổi chuỗi thành UTF8 trong Ruby

Tôi đang viết trình thu thập thông tin sử dụng Hpricot. Nó tải xuống một danh sách các chuỗi từ một số trang web, sau đó tôi cố gắng ghi nó vào tệp. Cái gì là sai với mã hóa: "\xC3" from ASCII-8BIT to

7Nhiệt

2Trả lời

Biến đổi ký tự unicode dạng dải

Cách đơn giản nhất để loại bỏ các công cụ sửa đổi ký tự từ một chuỗi unicode bằng Python là gì? Ví dụ: Arthur nên trở thành Arthur Tôi đã thử các tài liệu nhưng tôi không thể tìm thấy bất cứ điều gì m

5Nhiệt

5Trả lời

Không thể in ký tự tiếng Nga

Tôi có một chuỗi Nga mà tôi đã được mã hóa sang UTF-8 String str = "\u041E\u041A"; System.out.println("String str : " + str); Khi tôi in các chuỗi trong nhật thực console tôi nhận được ?? bất cứ ai

7Nhiệt

1Trả lời

Codec Python dòng kết thúc

Dường như mã hóa UTF-8 của Python (codecs gói) diễn giải các ký tự Unicode 28, 29 và 30 làm dòng kết thúc. Tại sao? Và làm thế nào tôi có thể ngăn chặn nó làm như vậy? Ví dụ mã: with open('unicodetest