Tôi muốn phân tích cú pháp một số HTML để tìm giá trị của một số thuộc tính/thẻ, v.v.Bạn nên giới thiệu thư viện phân tích HTML nào trong Java
Bạn khuyên bạn nên phân tích cú pháp HTML nào? Bất kỳ ưu và nhược điểm nào?
Tôi muốn phân tích cú pháp một số HTML để tìm giá trị của một số thuộc tính/thẻ, v.v.Bạn nên giới thiệu thư viện phân tích HTML nào trong Java
Bạn khuyên bạn nên phân tích cú pháp HTML nào? Bất kỳ ưu và nhược điểm nào?
Tôi đã thử HTML Parser vốn đã chết đơn giản.
Tôi đã sử dụng trình phân tích cú pháp HTML trên một dự án và nó hoạt động chính xác như mong đợi –
nhưng không có nhiều hướng dẫn ... – Lily
Tôi đã nhận thấy rất nhiều đoạn mã javascript (và thuộc tính phần tử) leo vào nút văn bản được cho là của tôi "nhổ răng. Cũng có một số trường hợp HTML không đúng định dạng khiến toàn bộ quá trình phân tích cú pháp thất bại. Vì vậy, tôi đang tìm kiếm để thay thế các thư viện htmlparser trong dự án của riêng tôi với một cái gì đó tốt hơn một chút. – benjismith
Bạn có cần phân tích cú pháp HTML đầy đủ không? Nếu bạn chỉ tìm kiếm các giá trị cụ thể trong nội dung (một thẻ/thông số cụ thể), thì một biểu thức chính quy đơn giản có thể là đủ và có thể nhanh hơn.
XPath là cách để phân tích cú pháp HTML, nó giúp trong trường hợp HTML được định dạng sai cũng như khi regex không thành công. –