Từ nguồn html này:Sử dụng BeautifulSoup để trích xuất văn bản trước khi đứa con đầu lòng tag
<div class="category_link">
Category:
<a href="/category/personal">Personal</a>
</div>
tôi muốn trích xuất các văn bản Category:
Dưới đây là những nỗ lực của tôi sử dụng Python/BeautifulSoup (với sản lượng như bình luận - sau #)
parsed = BeautifulSoup(sample_html)
parsed_div = parsed.findAll('div')[0]
parsed_div.firstText() # <a href="/category/personal">Personal</a>
parsed_div.first() # <a href="/category/personal">Personal</a>
parsed_div.findAll()[0] # <a href="/category/personal">Personal</a>
Tôi mong đợi một "nút văn bản" khả dụng khi là đứa con đầu tiên. Bất kỳ đề xuất về cách tôi có thể giải quyết điều này?
'parsed_div.contents [0] ' – Avaris