Tôi đang cạo một trang web sử dụng Scrapy yêu cầu phải bật chế độ nấu ăn và tập lệnh java. Tôi không nghĩ rằng tôi sẽ phải thực sự xử lý javascript. Tất cả những gì tôi cần là giả vờ như javascript được kích hoạt.Làm thế nào để gửi JavaScript và Cookies được kích hoạt trong Scrapy?
Dưới đây là những gì tôi đã cố gắng: 1) Bật Cookie qua sau trong cài đặt
COOKIES_ENABLED = True
COOKIES_DEBUG = True
2) Sử dụng tải middleware cho cookie
DOWNLOADER_MIDDLEWARES = {
'scrapy.contrib.downloadermiddleware.useragent.UserAgentMiddleware': 400,
'scrapy.contrib.downloadermiddleware.cookies.CookiesMiddleware':700
}
3) Gửi 'X-hỗ trợ JavaScript ':' Đúng '
DEFAULT_REQUEST_HEADERS={
'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
'Accept-Language': 'en',
'X-JAVASCRIPT-ENABLED': 'True'
}
nhưng không ai trong số họ đang làm việc với tôi. Bạn có thể đề nghị bất kỳ ý tưởng hoặc cho tôi một số hướng?
Cảm ơn bạn trước đã trả lời.
Akhter, Cảm ơn bạn đã trả lời. Như tôi đã nói, tôi sẽ không cần xử lý JavaScript. Máy chủ sẽ không cung cấp cho tôi trang thực nếu hạt giống javascript không được bật trên nguồn yêu cầu. Tôi chỉ cần gửi tín hiệu đến máy chủ mà javascript và cookie được bật. –