Tôi đã thử phân loại vịnh ruồi ngây thơ và nó hoạt động rất tệ. SVM hoạt động tốt hơn một chút nhưng vẫn khủng khiếp. Hầu hết các bài báo tôi đọc về SVM và vịnh ngây thơ với một số biến thể (n-gram, POS vv) nhưng tất cả đều cho kết quả gần 50% (tác giả của bài viết nói về 80% và cao nhưng tôi không thể có được chính xác trên dữ liệu thực).Thuật toán tốt cho phân tích tình cảm
Có phương pháp mạnh mẽ hơn ngoại trừ analyser lexixal không? SVM và Bayes giả sử rằng các từ được độc lập. Cách tiếp cận này được gọi là "túi từ". Điều gì sẽ xảy ra nếu chúng ta cho rằng các từ đó được liên kết?
Ví dụ: Sử dụng thuật toán apriory để phát hiện rằng nếu câu có chứa "xấu và khủng khiếp" thì 70% xác suất câu đó là âm. Ngoài ra chúng ta có thể sử dụng khoảng cách giữa các từ và vân vân.
Ý tưởng hay là tôi đang sáng tạo ra xe đạp?
Bạn nghĩ gì về thuật toán apriory và sự đồng hóa giữa các từ? – Neir0
@ Neir0: Tôi không thấy ngay bạn muốn áp dụng nó như thế nào. Tôi cũng chưa bao giờ thấy nỗ lực làm phân tích tình cảm với nó. Tôi biết rằng một số người sử dụng nó để xây dựng xấp xỉ với hạt nhân bậc hai (gần như những gì bạn gọi là "hiệp hội từ"), nhưng sau đó tôi muốn thử một hạt nhân vani SVM đầu tiên. –
Cách đơn giản là nhập mã thông báo có dấu hiệu hoặc vị trí huy hiệu. Ví dụ: "pos i love my mom". Về sản lượng tôi nhận được một cái gì đó như "nếu chúng ta có tình yêu và mẹ trong phân sau đó 70% mà chúng tôi có huy hiệu pos". Tất nhiên chúng ta có thể sửa đổi cách tiếp cận này để có kết quả tốt hơn. – Neir0