Tôi đang mua một khung nguồn mở để viết các quy tắc ngữ pháp ngôn ngữ tự nhiên cho khớp mẫu trên chú thích. Bạn có thể nghĩ về nó như regexps nhưng phù hợp với mã thông báo chứ không phải là cấp độ nhân vật. Khung như vậy sẽ cho phép các tiêu chí đối sánh tham chiếu các thuộc tính khác gắn liền với các mã thông báo đầu vào hoặc các nhịp, cũng như sửa đổi các thuộc tính đó trong một hành động.Khuôn khổ khai thác mẫu/thông tin dựa trên quy tắc dựa trên quy tắc nguồn mở?
Có ba lựa chọn Tôi biết trong số đó phù hợp với mô tả này:
- GATE Java Expressions over Annotations (JAPE)
- Stanford CoreNLP's TokensRegex
- UIMARuta (Tutorial)
- Graph Expression (GExp) *
Có bất kỳ lựa chọn nào khác có sẵn vào thời điểm này không?
cụ liên quan
- Trong khi tôi biết rằng máy phát điện phân tích cú pháp chung chung như Antlr cũng có thể phục vụ mục đích này, tôi đang tìm một cái gì đó mà được thiết kế đặc biệt hơn cho xử lý ngôn ngữ tự nhiên hoặc khai thác thông tin.
- UIMA bao gồm plugin Regex Annotator để khai báo quy tắc trong XML, nhưng dường như hoạt động ở ký tự thay vì đối tượng cấp cao.
- Tôi biết rằng loại tác vụ này thường được thực hiện với các mô hình thống kê, nhưng đối với các miền hẹp, có cấu trúc, có lợi trong các quy tắc tạo thủ công.
* Với quy tắc GExp 'thực sự được triển khai trong mã nhưng vì có quá ít tùy chọn tôi đã chọn để bao gồm nó.
[TextMarker] (http://sourceforge.net/projects/textmarker/) dường như tương đương với JAPE cho UIMA. Nhưng tôi đã không sử dụng nó bản thân mình. –
Cảm ơn bạn, đó là một bổ sung tốt cho danh sách. –
Ruta (trước đây là TextMarker) có hướng dẫn hay, hãy thử – Renaud