Tôi thấy this bài đăng để thu thập dữ liệu bất kỳ trang web nào mà không có giới hạn miền được phép.cho phép tất cả các tên miền
Có cách nào tốt hơn để làm việc đó, chẳng hạn như sử dụng một biểu thức chính quy trong biến miền được phép, như-
allowed_domains = ["*"]
Tôi hy vọng có một số cách khác hơn là xâm nhập vào khuôn khổ scrapy để làm điều này.
Cảm ơn. Nhưng, tôi muốn đặt allow_domains cho tất cả, là có thể? – riship89
Nếu bạn không đặt allow_domains thì tất cả các tên miền được cho phép theo mặc định. –