OK Tôi đang thử nghiệm với gấu trúc để tải xung quanh một tập tin csv 30GB với 40 triệu + hàng và 150 + cột vào HDFStore. Phần lớn các cột là chuỗi, theo sau là số và ngày tháng. Tôi chưa bao giờ thực
Làm thế nào tôi có thể sử dụng pd.read_csv() để lặp đi lặp lại đoạn thông qua một tập tin và giữ lại dtype và meta-thông tin khác như thể tôi đọc trong toàn bộ bộ dữ liệu cùng một lúc? Tôi cần đọc tro
Tôi đang cố gắng chọn các hàng ngẫu nhiên từ bảng HDFStore khoảng 1 GB. Sử dụng RAM phát nổ khi tôi yêu cầu khoảng 50 hàng ngẫu nhiên. Tôi đang sử dụng gấu trúc 0-11-dev, python 2.7, linux64. Trong tr