2012-06-21 29 views
5

Tôi đã làm việc trên phân tích tình cảm cấp tài liệu kể từ 1 năm qua. Phân tích tình cảm cấp tài liệu cung cấp tình cảm của tài liệu hoàn chỉnh. Ví dụ - Các văn bản "Nokia là tốt nhưng vodafone sucks thời gian lớn" sẽ có một cực âm liên kết với nó vì nó sẽ là bất khả tri đối với các thực thể Nokia và Vodafone. Làm thế nào để có thể nhận được tình cảm cấp độ thực thể, như tích cực cho Nokia nhưng tiêu cực đối với Vodafone? Có giấy tờ nghiên cứu nào cung cấp giải pháp cho những vấn đề như vậy không?Phân tích ý kiến ​​của thực thể

+0

Bạn có thể muốn tìm kiếm giấy tờ về việc quản lý danh tiếng. Tuy nhiên, thực hiện điều đó hoàn toàn tự động là một câu hỏi nghiên cứu mở. –

Trả lời

3

Bạn có thể tìm kiếm các thực thể và nhân vật cốt lõi của họ, và có một ý thức đơn giản như cho mỗi tình cảm thực thể từ thuật ngữ tình cảm gần nhất, có lẽ gần nhất bằng khoảng cách trong cây phân tích phụ thuộc, trái ngược với tuyến tính. Mỗi bước trong số đó dường như là một chủ đề nghiên cứu mở.

http://scholar.google.com/scholar?q=entity+identification

http://scholar.google.com/scholar?q=coreference+resolution

http://scholar.google.com/scholar?q=sentiment+phrase

http://scholar.google.com/scholar?q=dependency+parsing

+0

và còn các ngôn ngữ khác thì sao? hoặc tiếng lóng và tiếng Anh không có cấu trúc, nơi cây phân tích phụ thuộc là hầu hết các prob. không chính xác ? có một số quy tắc thống kê hoặc bất kỳ cách tiếp cận nào khác không? –

+0

@HadyElsahar Tất cả những vấn đề mà bạn đã đề cập là những thách thức lớn trong lĩnh vực nghiên cứu này. Đặc điểm của các ngôn ngữ khác nhau có thể ảnh hưởng trực tiếp đến quá trình phân tích tài liệu. Ví dụ, ngôn ngữ Ba Tư khác với tiếng Anh ở nhiều khía cạnh. Kết quả là, bạn không thể đối phó với những thách thức bằng tiếng Ba Tư giống như tiếng Anh (Ví dụ, Tokenizing khá đơn giản bằng tiếng Anh, nhưng không dễ dàng bằng tiếng Ba Tư do sự tồn tại của một số phụ đề). Hơn nữa, cây Parse chỉ là một lựa chọn để giải quyết vấn đề. Bạn cũng có thể sử dụng các phương thức khác làm tính năng của mình. – Pedram

7

Bạn có thể thử Aspect cấp Phân tích Niềm tin. Có những nỗ lực tốt đã được thực hiện để tìm các ý kiến ​​về các khía cạnh trong một câu. Bạn có thể tìm thấy một số công trình here. Bạn cũng có thể đi xa hơn và sâu hơn và xem lại các giấy tờ có liên quan đến việc khai thác tính năng (khía cạnh). Nó có nghĩa là gì? Hãy để tôi cung cấp cho bạn một ví dụ:

"Chất lượng màn hình tuyệt vời, tuy nhiên, thời lượng pin ngắn".

Phân tích tình cảm cấp tài liệu có thể không cung cấp cho chúng tôi ý nghĩa thực sự của tài liệu này tại đây vì chúng tôi có một câu tích cực và một tiêu cực trong tài liệu. Tuy nhiên, theo khía cạnh khác nhau (khía cạnh mức độ) khai thác ý kiến, chúng ta có thể tìm ra các giác quan/phân cực đối với các thực thể khác nhau trong tài liệu một cách riêng biệt. Bằng cách khai thác tính năng, trong bước đầu tiên, bạn cố gắng tìm ra tính năng (khía cạnh) trong câu khác nhau (ở đây "chất lượng của màn hình" hoặc đơn giản là "chất lượng" và "tuổi thọ pin"). Sau đó, khi bạn có những khía cạnh này, bạn cố gắng trích xuất các ý kiến ​​liên quan đến những khía cạnh này ("tuyệt vời" cho "chất lượng" và "ngắn" cho "tuổi thọ pin"). Trong các nghiên cứu và tài liệu học thuật, chúng tôi cũng đặt tên các tính năng (các khía cạnh) là từ mục tiêu (các từ hoặc thực thể mà người dùng nhận xét) và ý kiến ​​là từ ý kiến ​​, các nhận xét đã được nêu về từ mục tiêu .

Bằng cách tìm kiếm các từ khóa mà tôi vừa đề cập, bạn có thể trở nên quen thuộc hơn với các khái niệm này.

0

Tôi cũng đã cố gắng tìm kiếm các bài viết nghiên cứu về vấn đề này nhưng không tìm thấy bất kỳ bài viết nào. Tôi khuyên bạn nên thử sử dụng các thuật toán phân tích tình cảm dựa trên khía cạnh. Sự giống nhau mà tôi tìm thấy là chúng ta nhận ra các khía cạnh của một thực thể đơn lẻ trong một câu và sau đó tìm thấy tình cảm của mỗi khía cạnh. những thực thể như vậy. Tôi đã không thử điều này nhưng tôi sẽ cho tôi biết nếu điều này có hiệu quả hay không.Ngoài ra còn có nhiều cách khác nhau để làm điều này. Sau đây là các liên kết cho vài bài viết.

http://arxiv.org/pdf/1605.08900v1.pdf https://cs224d.stanford.edu/reports/MarxElliot.pdf

+0

Tôi có thể lưu ý rằng câu hỏi này là 3 tuổi? Không nói thêm câu trả lời cho câu hỏi này không được mời, đặc biệt là nếu nó có thể có lợi cho độc giả trong tương lai, nhưng tôi cảm thấy lời khuyên cho OP anh/cô ấy là một chút quá muộn vào thời điểm này là có liên quan. –