Tôi đang viết một ứng dụng bằng java bằng cách sử dụng nhập org.jdom. *;Cách lấy nội dung của nút từ JDOM
XML của tôi hợp lệ, nhưng đôi khi nó chứa thẻ HTML. Ví dụ: một cái gì đó như thế này:
<program-title>Anatomy & Physiology</program-title>
<overview>
<content>
For more info click <a href="page.html">here</a>
<p>Learn more about the human body. Choose from a variety of Physiology (A&P) designed for complementary therapies.&#160; Online studies options are available.</p>
</content>
</overview>
<key-information>
<category>Health & Human Services</category>
Vì vậy, vấn đề của tôi là với các thẻ < p> bên trong nút overview.content.
Tôi đã hy vọng rằng mã này sẽ làm việc:
Element overview = sds.getChild("overview");
Element content = overview.getChild("content");
System.out.println(content.getText());
nhưng nó sẽ trả về trống.
Làm cách nào để trả lại tất cả văn bản (thẻ lồng nhau và tất cả) từ nút overview.content?
Cảm ơn
Hi, làm thế nào tôi có thể san bằng nút nội dung ra một cách đệ quy, khi văn bản được trộn lẫn với các nút khác. Ví dụ một siêu liên kết nằm ở giữa một câu. Tôi đã thêm tiền thưởng cho một số trợ giúp. –
Cần lấy tất cả HTML bên trong thẻ nội dung, bao gồm một liên kết và danh sách có thứ tự. Cảm ơn –