2010-10-04 6 views
6

Tôi cần phải tìm cho dù một từ là động từ hoặc danh từ hoặc nó là cảtìm danh từ và động từ trong stanford phân tích cú pháp

Ví dụ, từ này là "tìm kiếm" nó có thể được cả hai danh từ và động từ nhưng stanford phân tích cú pháp cho NN tag to it ..

là có cách nào mà phân tích cú pháp stanford sẽ cho rằng "tìm kiếm" là cả danh từ và động từ?

mã mà tôi sử dụng tại

public static String Lemmatize(String word) { 
    WordTag w = new WordTag(word); 
    w.setTag(POSTagWord(word)); 
    Morphology m = new Morphology(); 
    WordLemmaTag wT = m.lemmatize(w); 

    return wT.lemma(); 
} 

hay tôi nên sử dụng bất kỳ phần mềm khác để làm điều đó? vui lòng đề xuất cho tôi cảm ơn trước

Trả lời

8

Trình phân tích cú pháp Stanford đoán thẻ một phần của từ dựa trên thống kê ngữ cảnh. Bạn nên thực sự truyền đạt một câu hoàn chỉnh để xác định xem, trong câu đó, "tìm kiếm" là một danh từ hoặc một động từ.

Bạn không cần trình phân tích cú pháp đầy đủ chỉ để nhận thẻ part-of-speech. Stanford POS Tagger là đủ; nó cũng bao gồm các lớp học Morphology, nhưng nó cũng đưa bối cảnh vào tài khoản.

Nếu bạn muốn tất cả thẻ phần-of-speech rằng một từ tiếng Anh có thể mất đi, mà không đưa ra bối cảnh, sau đó WordNet có lẽ là một lựa chọn tốt hơn. Nó có một số giao diện Java, bao gồm JWNLJWI.

1

Trình phân tích cú pháp Stanford phân tích các từ trong ngữ cảnh của một câu. Để sử dụng ví dụ của bạn về "tìm kiếm", trong bất kỳ câu nào, "tìm kiếm" sẽ là một danh từ hoặc một động từ, nhưng không phải là một danh từ và một động từ trong cùng một câu.

Điều bạn đang tìm kiếm là từ điển tra cứu. Tôi đã tìm thấy một số từ điển trực tuyến sẽ cung cấp cho bạn thông tin bạn đang tìm kiếm. Dưới đây là ví dụ từ số Free Online Dictionary cho từ "tìm kiếm".

Nó chỉ ra rằng "tìm kiếm" có thể là một danh từ, động từ, động từ bên trong và động từ chuyển tiếp.

Tôi không thể tìm thấy giao diện lập trình ứng dụng (API) sẽ cung cấp cho bạn cùng một loại thông tin như bạn tìm thấy trên trang web Từ điển trực tuyến miễn phí. Nếu danh sách từ vựng của bạn bị giới hạn, bạn có thể xây dựng API của riêng mình.

+1

có một api cho Wordnik về cơ bản sẽ cung cấp: http://www.wordnik.com/developers – ealdent

+0

Cảm ơn bạn đã tìm liên kết. –

3

WordNet là những gì bạn muốn. Nó cung cấp một API cho một từ vựng tiếng Anh với các phần có thể nói, từ đồng nghĩa, từ ngữ, quan hệ hypernym/hyponym và nhiều hơn nữa.

Xem Yawni cho API WordNet thuần Java tuyệt vời.