Tôi đang sử dụng BeautifulSoup để cạo một url và tôi đã có đoạn mã sauchúng ta có thể sử dụng xpath với BeautifulSoup không?
import urllib
import urllib2
from BeautifulSoup import BeautifulSoup
url = "http://www.example.com/servlet/av/ResultTemplate=AVResult.html"
req = urllib2.Request(url)
response = urllib2.urlopen(req)
the_page = response.read()
soup = BeautifulSoup(the_page)
soup.findAll('td',attrs={'class':'empformbody'})
Bây giờ trong đoạn code trên chúng ta có thể sử dụng findAll
để có được thẻ và thông tin liên quan đến họ, nhưng tôi muốn sử dụng xpath. Có thể sử dụng xpath với BeautifulSoup không? Nếu có thể, bất cứ ai có thể vui lòng cung cấp cho tôi một mã ví dụ để nó có hữu ích hơn không?
Cảm ơn Pieters rất nhiều, tôi có hai thông tin từ mã ur, 1. Một làm rõ rằng chúng tôi không thể sử dụng xpath với BS 2.A ví dụ tốt đẹp về cách sử dụng lxml. Chúng ta có thể thấy nó trên một tài liệu cụ thể rằng "chúng ta không thể thực hiện xpath bằng BS dưới dạng văn bản", bởi vì chúng ta nên trình bày một số bằng chứng cho những người yêu cầu làm rõ đúng không? –
Dù sao, xin cảm ơn sự giúp đỡ của quý vị trước số –
Thật khó để chứng minh một tiêu cực; tài liệu [BeautifulSoup 4] (http://www.crummy.com/software/BeautifulSoup/bs4/doc/) có chức năng tìm kiếm và không có lần truy cập nào cho 'xpath'. –