Nếu bạn có một danh sách các chữ cái chung nhỏ nhất và cặp chữ cái trong bộ chuỗi, bạn có thể lưu trữ các bộ của bạn được sắp xếp với các chữ cái và cặp thư ít phổ biến nhất của chúng và tối đa hóa cơ hội tung ra các kết quả phủ định nhanh nhất có thể. 10 Nó không rõ ràng với tôi như thế nào tốt này sẽ kết hợp với một bộ lọc nở, Có lẽ một bảng băm sẽ làm vì không có rất nhiều digrams và chữ cái.
Nếu bạn có một số thông tin về kích thước tối đa các tập con hoặc thậm chí kích thước chung, bạn có thể xử lý trước dữ liệu tương tự bằng cách đặt tất cả các tập hợp con của một kích thước nhất định vào bộ lọc nở như đã đề cập.
Bạn cũng có thể kết hợp cả hai loại này.
Tìm thấy câu trả lời này: http://stackoverflow.com/a/1338515/174674 – volni
Chúng tôi cần thêm thông tin về nội dung đã đặt. Các thuật toán chung sẽ không cho bạn độ phức tạp liên tục. Ít nhất, tôi không biết. –
Các phần tử thiết lập là các chuỗi nhưng tất nhiên chúng ta có thể chạy chúng thông qua một số băm hoặc gán chúng vị trí trong một bitet nếu điều đó sẽ mang lại một thuật toán nhanh hơn. – volni