Trang tôi đang nhìn chứa:Cách lấy nguồn html của một phần tử cụ thể bằng selen?
<div id='1'> <p> text 1 <h1> text 2 </h1> text 3 <p> text 4 </p> </p> </div>
Tôi muốn để có được tất cả các văn bản trong div, trừ các văn bản đó là trong <h>
. (Tôi muốn nhận "văn bản 1", "văn bản 3" và "văn bản 4") Có thể có một vài yếu tố <h>
hoặc không có gì cả. Và có thể có một vài yếu tố <p>
, ngay cả một trong các phần tử khác hoặc không có phần tử nào.
Tôi đã nghĩ đến điều này bằng cách lấy tất cả nguồn html của div và sử dụng regex để xóa các phần tử <h>
. Nhưng selenium.get_text không trả lại html, chỉ là văn bản (tất cả!).
Tôi biết tôi có thể sử dụng selenium.get_html_source
và sau đó tìm phần tử tôi cần bằng regex, nhưng có vẻ như chất thải vì selenium biết cách tìm phần tử.
Có ai có giải pháp tốt hơn không? Cảm ơn :)
Cảm ơn! Nó giải quyết được vấn đề :) – Rivka
vậy tại sao bạn không chấp nhận câu trả lời? :) – luc
Xin lỗi, tôi mới ở trang này ... Bạn có nghĩa là nhấp vào v, phải không? – Rivka