scrapy

12Nhiệt

1Trả lời

Python Phế liệu, cách xác định đường dẫn cho một mục?

Tôi đang sử dụng scrapy để thu thập thông trang web khác nhau, cho mỗi trang web Tôi có một mục (thông tin khác nhau được chiết xuất) Vâng, ví dụ tôi có một đường ống dẫn chung (hầu hết các thông tin

10Nhiệt

1Trả lời

Scrapy SgmlLinkExtractor bị bỏ qua là bỏ qua các liên kết được phép

Vui lòng xem this spider example trong tài liệu Scrapy. Giải thích là: Con nhện này sẽ bắt đầu thu thập thông tin trang chủ example.com, thu thập liên kết danh mục và liên kết mục, phân tích cú pháp s

12Nhiệt

4Trả lời

Sử dụng một Spider phế liệu cho một số trang web

Tôi cần tạo một trình thu thập dữ liệu web/trình thu thập thông tin người dùng và tôi đang nghĩ đến việc sử dụng Scrapy. Tuy nhiên, tôi không thể mã hóa cứng các miền và cho phép URL regex: es - thay