urllib.urlretrieve
trả về âm thầm ngay cả khi tệp không tồn tại trên máy chủ http từ xa, nó chỉ lưu trang html vào tệp được đặt tên. Ví dụ:Làm thế nào để biết nếu urllib.urlretrieve thành công?
urllib.urlretrieve('http://google.com/abc.jpg', 'abc.jpg')
chỉ trả về lặng lẽ, thậm chí nếu abc.jpg không tồn tại trên máy chủ google.com, được tạo ra abc.jpg
không phải là một tập tin jpg hợp lệ, nó thực sự là một trang html. Tôi đoán các tiêu đề được trả lại (một cá thể httplib.HTTPMessage) có thể được sử dụng để thực sự cho biết các thành công truy xuất hay không, nhưng tôi không thể tìm thấy bất kỳ tài liệu nào cho httplib.HTTPMessage
.
Ai đó có thể cung cấp một số thông tin về vấn đề này không?
Có thể urllib2 cung cấp hành vi đệm ẩn của urlretrieve hay không? Hay chúng ta phải thực hiện lại nó? – Kiv
Hãy xem sự tương tác khó chịu này từ ActiveState: http://code.activestate.com/recipes/491261/ Chúng tôi đang sử dụng nó trong dự án hiện tại của chúng tôi, hoạt động hoàn hảo –
urlopen không cung cấp chức năng móc (để hiển thị thanh tiến trình cho ví dụ) như urlretrieve. –