Tôi đang cố sử dụng mô-đun zipfile để đọc tệp trong một tệp lưu trữ. các tập tin không nén là ~ 3GB và tập tin nén là 200MB. Tôi không muốn chúng trong bộ nhớ khi tôi xử lý dòng tập tin nén theo dòng. Cho đến nay tôi đã nhận thấy một lạm dụng bộ nhớ sử dụng đoạn mã sau:Đọc dòng tệp văn bản được nén lớn theo dòng trong python
import zipfile
f = open(...)
z = zipfile.ZipFile(f)
for line in zipfile.open(...).readlines()
print line
tôi đã làm nó trong C# sử dụng SharpZipLib:
var fStream = File.OpenRead("...");
var unzipper = new ICSharpCode.SharpZipLib.Zip.ZipFile(fStream);
var dataStream = unzipper.GetInputStream(0);
Datastream là không nén. Tôi không thể tìm cách để làm điều đó trong Python. Trợ giúp sẽ được đánh giá cao.
không thể nói tốt hơn –