Tôi tương đối mới với cơ sở dữ liệu NoSQL và tôi phải đánh giá các giải pháp NoSQL khác nhau cho một công cụ giám sát.CouchDB có thể xử lý 15 triệu bản ghi hàng ngày không?
Tình huống như sau: Một mốc dữ liệu chỉ khoảng 100 byte lớn, nhưng thực sự có rất nhiều dữ liệu. Trong một ngày, chúng tôi có khoảng 15 triệu bản ghi ... Vì vậy, tôi hiện đang thử nghiệm với 900 triệu bản ghi (khoảng 15 GB dưới dạng Tập lệnh Chèn SQL)
Câu hỏi của tôi là: Couchdb có phù hợp với nhu cầu của tôi không? Tôi cần phải làm các truy vấn phạm vi (vào ngày các hồ sơ được tạo ra) và tổng hợp một số cột theo các nhóm được xác định bởi "chỉ số phụ" được lưu trữ trong mốc.) Tôi biết rằng MapReduce có lẽ là giải pháp tốt nhất để tính toán , nhưng là JavaScript của CouchDB có thể làm điều này trong một thời gian chấp nhận được?
Tôi đã thử MongoDB nhưng nó thực sự nghèo MapReduce đã thực hiện một công việc crappy ... Tôi cũng đọc về HBase và Cassandra. Nhưng maybee CouchDB cũng là một khả năng tốt
Tôi hy vọng tôi đã cung cấp cho bạn tất cả các thông tin cần thiết ... Cảm ơn sự giúp đỡ của bạn!
andy
Đầu tiên, cách duy nhất để biết hiệu suất là đo lường vì có quá nhiều biến để đoán. Thứ hai, không quá hấp dẫn để lưu trữ được lưu trữ khi một nửa thế kỷ kinh nghiệm RDBM đang chờ xử lý dữ liệu 100 octet của bạn. Tôi đoán tại 100B/hàng, dữ liệu của bạn không phải là rất biến thể (nơi SS trội). – msw
Điểm tốt, @msw. Tất nhiên, cách để * definitively * biết hiệu suất là đo lường; tuy nhiên tôi cho rằng nó là hợp lệ để yêu cầu ước tính ước tính đầu tiên, ước tính của ballpark. Tôi đã sửa đổi tiêu đề câu hỏi thành màu đen và trắng hơn một chút. (Không chắc chắn nếu bạn bỏ phiếu để đóng hoặc đó là một người nào khác, nhưng IMHO nó là một câu hỏi công bằng.) Cuối cùng, hoàn toàn đúng về RDBM. Chúng có giá trị hơn chúng ta cho tín dụng. – JasonSmith
Dữ liệu tôi đang đánh giá hiện đang được xử lý bởi một SQL-Server thực sự mạnh mẽ. Nhưng nó không thể xử lý các yêu cầu mà người dùng gửi để thu thập thông tin từ khối lượng dữ liệu. Nó chỉ đơn giản là cần nhiều thời gian. Đó là lý do tại sao chúng tôi tìm kiếm NoSQL-Solutions với khả năng mở rộng theo chiều ngang. – andy