Có thể giải thích cho tôi sự khác biệt giữa   and
không?Sự khác biệt giữa và
Tôi có dữ liệu html được lưu trữ trong cơ sở dữ liệu ở dạng nhị phân và không gian trong đó có thể là
hoặc  
hoặc đôi khi  
.
Vấn đề nữa là khi tôi chuyển đổi HTML này thành văn bản thuần túy sử dụng JSoup lib
nó đang chuyển đổi đúng cách nhưng nếu tôi sử dụng phương thức String.contains (chuỗi của tôi). Có vẻ như dữ liệu HTML có số
khác với dữ liệu có số  
. Chuỗi không được tìm thấy trong hoặc ngược lại.
Ví dụ:
HTML1: This is my test string
HTML2: This is my test string
Nếu tôi chuyển nó sang văn bản đơn giản sử dụng JSoup. Nó trả
HTML 1: Đây là chuỗi thử nghiệm của tôi
HTML 2: Đây là chuỗi thử nghiệm của tôi
Nhưng vẫn cả hai chuỗi là không giống nhau. Tại sao nó như vậy?
Có cách nào để tìm mã hóa phong cách của văn bản hiện tại? – Ketan