Chúng tôi đang thiết kế bản cập nhật cho hệ thống hiện tại (C++ \ CLI và C#). Hệ thống sẽ thu thập một lượng dữ liệu nhỏ (~ 1Mb) từ ~ 10K thiết bị (trong tương lai gần). Hiện tại, chúng được sử dụng để lưu dữ liệu thiết bị trong một CSV (một bảng) và lưu trữ tất cả các dữ liệu này trong một cấu trúc thư mục rộng.Cơ sở dữ liệu SQL VS. Nhiều tệp phẳng (Hàng nghìn tệp CSV nhỏ)
Dữ liệu chỉ được chèn (tạo/thêm vào một tệp, tạo thư mục) không bao giờ được cập nhật/xóa. Xử lý dữ liệu được thực hiện bằng cách đọc nhiều tệp CSV cho một chương trình bên ngoài (như Matlab). Chủ yếu được sử dụng để phân tích thống kê.
Có một tùy chọn để bắt đầu lưu dữ liệu này vào cơ sở dữ liệu MS-SQL. Thời gian xử lý (đọc CSV của chương trình bên ngoài) có thể lên tới vài phút.
- Chúng ta nên chọn phương pháp nào để sử dụng?
- Một trong những phương pháp có lưu trữ nhiều hơn đáng kể so với phương pháp kia không?
- Nói chung, khi đọc dữ liệu thô từ cơ sở dữ liệu trở nên nhanh hơn việc đọc dữ liệu của CSV? (10 tệp, 100 tệp? ...)
Tôi đánh giá cao câu trả lời của bạn, Ưu và khuyết điểm được hoan nghênh.
Cảm ơn bạn đã dành thời gian.
Đây là một trong những câu hỏi mà bạn chỉ có thể trả lời bằng cách dùng thử. – Gabe
Bạn cũng có thể xem xét sử dụng cơ sở dữ liệu noSQL. – HLGEM