Có bất kỳ liên kết/tài nguyên nào đối với các tiêu chí hiệu suất cho Lucene/Solr trên các tập dữ liệu lớn hay không. Bộ dữ liệu trên khoảng 500GB ~ 5TBTôi có thể tìm thấy điểm chuẩn hiệu suất cho Apache Lucene/Solr
Cảm ơn
Có bất kỳ liên kết/tài nguyên nào đối với các tiêu chí hiệu suất cho Lucene/Solr trên các tập dữ liệu lớn hay không. Bộ dữ liệu trên khoảng 500GB ~ 5TBTôi có thể tìm thấy điểm chuẩn hiệu suất cho Apache Lucene/Solr
Cảm ơn
Lucene committer Mike McCandless chạy benchmarks một cách thường xuyên để theo dõi màn trình diễn cải thiện và hồi quy. Chúng được thực hiện với xuất khẩu Wikipedia, có thể nhỏ hơn một chút so với những gì bạn đang tìm kiếm.
Nhưng hiệu suất không phụ thuộc quá nhiều vào kích thước đầu vào, mà là phụ thuộc vào số lượng tài liệu và thuật ngữ duy nhất. Nếu bạn đã có một số dữ liệu tương tự với những gì bạn cần lập chỉ mục, tôi khuyên bạn nên kiểm tra Mike's test tool, điều chỉnh theo nhu cầu của bạn và chạy nó với bộ dữ liệu và phần cứng của riêng bạn để tìm hiểu loại số hiệu suất nào bạn có thể chờ đợi.