SVD-python Thực hiện rất rõ ràng, phân tích cú pháp SVD. Đó là thực tế psuedocode và nên được khá dễ hiểu và so sánh/vẽ trên cho thực hiện php của bạn, ngay cả khi bạn không biết nhiều python.
SVD-python
Điều đó nói rằng, như những người khác đã đề cập đến tôi sẽ không mong đợi để có thể làm LSA rất nặng với thực hiện php gì nghe có vẻ giống như một web-host khá hạn chế.
Cheers
Edit: Các module trên không làm bất cứ điều gì cả bởi chính nó, nhưng có một ví dụ bao gồm trong ý kiến khai mạc. Giả sử bạn đã tải về các mô-đun python, và nó đã truy cập (ví dụ trong cùng một thư mục), bạn có thể thực hiện một ví dụ nhỏ như sau,
#!/usr/bin/python
import svd
import math
a = [[22.,10., 2., 3., 7.],
[14., 7.,10., 0., 8.],
[-1.,13.,-1.,-11., 3.],
[-3.,-2.,13., -2., 4.],
[ 9., 8., 1., -2., 4.],
[ 9., 1.,-7., 5.,-1.],
[ 2.,-6., 6., 5., 1.],
[ 4., 5., 0., -2., 2.]]
u,w,vt = svd.svd(a)
print w
đây 'w' chứa danh sách các giá trị duy nhất.
Tất nhiên điều này chỉ giúp bạn trở thành một phần của cách phân tích ngữ nghĩa tiềm ẩn và người thân của nó. Bạn thường muốn giảm số lượng giá trị số ít, sau đó sử dụng một số khoảng cách thích hợp để đo lường sự tương tự giữa tài liệu hoặc từ hoặc tài liệu và từ, v.v. Cosin của góc giữa các vectơ kết quả của bạn khá phổ biến .
Latent Semantic Mapping (pdf)
đến nay là ngắn gọn và thông tin hầu hết giấy rõ ràng, tôi đã đọc trên các bước còn lại bạn cần phải làm việc ra sau SVD.
Chỉnh sửa2: cũng lưu ý rằng nếu bạn đang làm việc với các ma trận tài liệu có độ dài rất lớn (tôi giả định đây là là những gì bạn đang làm) gần như chắc chắn sẽ hiệu quả hơn để thực hiện phân tích một chế độ ngoại tuyến, và sau đó chỉ thực hiện các so sánh theo kiểu sống theo yêu cầu. trong khi svd-python là tuyệt vời cho việc học tập, svdlibc là nhiều hơn những gì bạn sẽ muốn cho tính toán nặng như vậy .
cuối cùng như đã đề cập trong giấy bellegarda ở trên, hãy nhớ rằng bạn không cần phải tính toán lại mỗi lần bạn nhận được tài liệu hoặc yêu cầu mới. tùy thuộc vào những gì bạn đang cố gắng để làm bạn có thể có thể thoát khỏi việc thực hiện svd một lần mỗi tuần hoặc lâu hơn, trong chế độ ngoại tuyến, máy cục bộ, và sau đó tải lên kết quả (kích thước/băng thông quan tâm mặc dù).
dù sao thì may mắn!
Nhận xét của bạn bằng tiếng Đức rất hữu ích. Tại sao bạn cần phải thực hiện các thuật toán phức tạp như vậy trong PHP? –
Nếu ai đó cần ý kiến bằng tiếng Anh, tôi có thể dịch chúng, tất nhiên. Tôi phải thực hiện nó trong PHP vì tôi không thể cài đặt các thư viện bên ngoài trên webspace của tôi. – caw
có mùi giống như bài tập về nhà – VVS