Tôi đang sử dụng scrapy để thu thập thông trang web khác nhau, cho mỗi trang web Tôi có một mục (thông tin khác nhau được chiết xuất) Vâng, ví dụ tôi có một đường ống dẫn chung (hầu hết các thông tin
Vui lòng xem this spider example trong tài liệu Scrapy. Giải thích là: Con nhện này sẽ bắt đầu thu thập thông tin trang chủ example.com, thu thập liên kết danh mục và liên kết mục, phân tích cú pháp s
Tôi cần tạo một trình thu thập dữ liệu web/trình thu thập thông tin người dùng và tôi đang nghĩ đến việc sử dụng Scrapy. Tuy nhiên, tôi không thể mã hóa cứng các miền và cho phép URL regex: es - thay