Công việc của tôi đang lên kế hoạch sử dụng cụm UIMA để chạy tài liệu thông qua trích xuất các thực thể được đặt tên và những gì không. Như tôi đã hiểu, UIMA có rất ít thành phần NLP được đóng gói cùng với nó. Tôi đã thử nghiệm GATE một thời gian và khá thoải mái với nó. Nó không ok trên văn bản bình thường, nhưng khi chúng tôi chạy nó thông qua một số dữ liệu thử nghiệm đại diện, độ chính xác giảm xuống. Dữ liệu văn bản mà chúng tôi có nội bộ đôi khi là tất cả các chữ cái, đôi khi là tất cả chữ thường hoặc kết hợp cả hai trong cùng một tài liệu. Ngay cả khi sử dụng tất cả các quy tắc mũ của ANNIE, độ chính xác vẫn còn nhiều để được mong muốn. Gần đây tôi đã nghe nói về Stanford NLP và OpenNLP nhưng chưa có thời gian để đào tạo và kiểm tra chúng một cách rộng rãi. Làm thế nào để hai so sánh về độ chính xác với ANNIE? Họ có làm việc với UIMA như GATE không?Độ chính xác: ANNIE so với Stanford NLP so với OpenNLP với UIMA
Xin cảm ơn trước.
ANNIE dựa trên quy tắc. Tôi đoán là Stanford NLP và OpenNLP nên hoạt động tốt hơn vì chúng dựa trên ML. –