Hiện tại Mahout 0.8-SNAPSHOT bao gồm một phiên bản Variational Bayes (cvb) cho mô hình chủ đề và loại bỏ phương pháp phân tích gián tiếp Dirichlet (lda), vì cvb có thể được song song theo cách tốt hơn. Rất tiếc, chỉ có tài liệu cho lda về cách chạy một ví dụ và tạo ra kết quả có ý nghĩa.Chạy cvb trong mahout 0.8
Vì vậy, tôi muốn:
- preprocess một số văn bản một cách chính xác
- chạy phiên bản cvb0_local của CVB
- kiểm tra kết quả bằng cách nhìn vào dòng chữ n hàng đầu tại mỗi trong những chủ đề được tạo ra
có cách nào để retrive eache chủ đề documen ts? hoặc cách khác, để lấy lại chủ đề tài liệu? –