Xin lỗi nếu điều này là ngu ngốc nhưng tôi đã chỉ nghĩ rằng tôi nên cung cấp cho một shot. Nói rằng tôi có một đồ thị thats rất lớn (ví dụ, 100 tỷ nút). Neo4J hỗ trợ 32 tỷ và những người khác hỗ trợ nhiều hơn hoặc ít hơn như nhau, vì vậy nói rằng tôi không thể có toàn bộ tập dữ liệu trong cơ sở dữ liệu cùng một lúc, tôi có thể chạy pagerank trên nó nếu đồ thị được chỉ dẫn (không có vòng lặp) và mỗi bộ kết nối đến tập hợp các nút tiếp theo (vì vậy sẽ không có liên kết mới nào được tạo ngược, chỉ các liên kết mới được tạo cho các tập hợp dữ liệu mới).Có thể thực hiện pagerank mà không có toàn bộ tập dữ liệu không?
Có cách nào bằng cách nào đó tôi có thể lấy điểm số pagerank trước đó và áp dụng chúng cho bộ dữ liệu mới không? Tôi chỉ quan tâm đến pagerank cho tập dữ liệu gần đây nhất nhưng cần pagerank của tập trước để lấy dữ liệu bộ cuối cùng)?
Điều đó có hợp lý không? Nếu vậy, có thể làm được không?
Tôi đoán Riak có thể xử lý số lớn hơn và có thể đi qua ** liên kết ** của MapReduce – aitchnyu