2011-12-27 12 views
7

Mặc dù tôi có nền tảng EE, nhưng tôi không có cơ hội tham dự các lớp xử lý ngôn ngữ tự nhiên.Cách tôi có thể bắt đầu xây dựng wordnet cho ngôn ngữ Thổ Nhĩ Kỳ để sử dụng trong phân tích tình cảm

Tôi muốn xây dựng công cụ phân tích tình cảm cho ngôn ngữ Thổ Nhĩ Kỳ. Tôi nghĩ tốt nhất là tạo một cơ sở dữ liệu wordnet của Thổ Nhĩ Kỳ thay vì dịch văn bản sang tiếng Anh và phân tích nó bằng văn bản được dịch với các công cụ được cung cấp. (là nó?)

Vậy các bạn khuyên tôi nên làm gì? Trước tiên, tham gia các lớp NLP từ một trang web mở? Tôi thực sự không biết bắt đầu từ đâu. Bạn có thể giúp tôi và có thể cung cấp cho tôi hướng dẫn từng bước? Tôi biết đây là một dự án học thuật nhưng tôi quan tâm đến việc xây dựng các kỹ năng như một sở thích trong khu vực đó.

Xin cảm ơn trước.

+0

Bạn có thể quan tâm đến việc tuân theo các đề xuất cho potentia l trang web SE mới bao gồm [Ngôn ngữ Thổ Nhĩ Kỳ & Sử dụng] (http://area51.stackexchange.com/proposals/30873/turkish-language-usage?referrer=wKPqNxBBY-xKcrw-ScJbLA2) và [StackOverflow bằng tiếng Thổ Nhĩ Kỳ] (http://area51.stackexchange.com/proposals/34945/stack-overflow-in-turkish?referrer=6DTBHmak2NY7uyvjVsZajA2). – Caleb

+0

Tôi nghĩ rằng bạn đang đúng về việc cần xây dựng một từ tiếng Thổ Nhĩ Kỳ và cơ sở dữ liệu cụm từ cho điều này thay vì dịch. Tuy nhiên tôi không chắc đây là nơi tốt nhất cho câu hỏi này. Đây có thể là một câu hỏi thích hợp để di chuyển đến trang [Programmers.SE] (http://programmers.stackexchange.com/) như là một vấn đề khái niệm chứ không phải là vấn đề mã hóa. Suy nghĩ? – Caleb

+1

Bạn có thể đúng. Tìm cách di chuyển đến phần đó. –

Trả lời

3

Dưới đây là quá trình tôi đã sử dụng trước đó (làm cho Nhật Bản, Trung Quốc, Đức và mạng ngữ nghĩa tiếng Ả Rập):

  1. Thu thập ít nhất hai bộ từ điển tiếng Anh Thổ Nhĩ Kỳ /. Chúng phải độc lập, không bắt nguồn từ nhau. Bạn có thể sử dụng Wikipedia để tự động tạo một trong các từ điển của bạn. Nếu bạn cần xuất bản mạng của mình, thì bạn có thể cần từ điển nguồn mở hoặc phí giấy phép hoặc luật sư.
  2. Sử dụng các từ điển đó để dịch từ vựng tiếng Anh, tạo ra xếp hạng tin cậy cho mỗi tập hợp.
  3. Giữ những người có sự tự tin mạnh mẽ, tự phê duyệt hoặc sửa chữa thông qua những người có độ tin cậy trung bình hoặc thấp.
  4. Kết thúc nó đi bằng tay

tôi mở rộng về vấn đề này trong "Tự động dịch Trong WordNet" của giấy 2008 của tôi: http://dcook.org/mlsn/about/papers/nlp2008.MLSN_A_Multilingual_Semantic_Network.pdf

(Đối với mục tiêu nêu lại một cuốn từ điển tình cảm của Thổ Nhĩ Kỳ, có khác Ví dụ: "Phân tích ngữ nghĩa và khai thác ý kiến", bởi Bing Liu, là một vòng nghiên cứu tốt. Nhưng một cách tiếp cận mạng ngữ nghĩa sẽ, IMHO, luôn mang lại kết quả tốt hơn trong thời gian dài, và rất nhiều công dụng khác.)