Không chắc chắn nếu có bất kỳ thứ gì với Mechanize hoặc BeautifulSoup có thể giúp ích. Bất kỳ đề xuất sẽ được đánh giá rất cao!Làm cách nào để phân tích cú pháp thông qua trang cuộn vô hạn (ví dụ: Wallbase.cc/search/sky) bằng Python?
6
A
Trả lời
3
Cơ chế và canh đẹp không thể làm nổi bật bằng javascript được sử dụng cho cuộn vô hạn.
Selen có thể.
Ngoài ra nếu bạn đã xem các yêu cầu ajax khi bạn sử dụng các cuộn vô hạn bạn sẽ thấy một yêu cầu bưu điện đến http://wallbase.cc/search/160
với các dữ liệu yêu cầu:
query:sky
board:123
res_opt:eqeq
res:0x0
aspect:0
nsfw_sfw:1
nsfw_sketchy:0
nsfw_nsfw:0
thpp:32
orderby:relevance
orderby_opt:desc
160 tương ứng với dãy hình ảnh để yêu cầu trước khi nó là wallbase.cc/searc/128
.
Vì vậy, nếu tôi muốn cạo các hình nền và viết từng thư mục vào một thư mục, làm thế nào tôi có thể vượt qua javascript được sử dụng để tải cuộn vô hạn để tải trang tiếp theo của hình nền? Hiện tại tôi chỉ có thể lấy các hình nền tất cả các con đường lên cho đến khi javascript nó được tải. – Rev3rb