Điều này có thể: để nhận (tương tự) chức năng nhận dạng đối tượng Stanford được đặt tên chỉ sử dụng NLTK không?Chức năng nhận diện đối tượng được đặt tên Stanford (NER) với NLTK
Có ví dụ nào không?
Cụ thể, tôi quan tâm đến việc khai thác phần LOCATION của văn bản. Ví dụ, từ văn bản
Cuộc họp sẽ được tổ chức tại 22 Tây Westin st., South Carolina, 12345 vào ngày-18
lý tưởng tôi muốn có được một cái gì đó giống như
(S
22/LOCATION
(LOCATION West/LOCATION Westin/LOCATION)
st./LOCATION
,/,
(South/LOCATION Carolina/LOCATION)
,/,
12345/LOCATION
.....
hoặc đơn giản là
22 West Westin st., South Carolina, 12345
Thay vào đó, tôi chỉ có thể nhận được
(S
The/DT
meeting/NN
will/MD
be/VB
held/VBN
at/IN
22/CD
(LOCATION West/NNP Westin/NNP)
st./NNP
,/,
(GPE South/NNP Carolina/NNP)
,/,
12345/CD
on/IN
Nov.-18/-NONE-)
Lưu ý rằng nếu tôi nhập văn bản của tôi vào http://nlp.stanford.edu:8080/ner/process tôi nhận được kết quả xa hoàn hảo (số đường phố và mã zip vẫn đang mất tích) nhưng ít nhất "st. " là một phần của LOCATION và South Carolina là LOCATION và không phải là một số "GPE/NNP":?
Tôi đang làm gì sai? làm thế nào tôi có thể sửa chữa nó để sử dụng NLTK để trích xuất mảnh vị trí từ một số văn bản xin vui lòng?
Rất cám ơn trước!
Bạn có biết tôi có thể đào tạo Stanford NER hay không? Tôi đã thử nó với. "Wizard of Oz rời khỏi Emerald City." và "Alexander Đại đế chinh phục Đế chế Ba Tư." Không làm việc. – Hans
@edfward java chạy nó trên cổng 9191 nhưng con trăn chạy nó trên cổng 8080. Tại sao vậy? – bernie2436
@ akh2103 lỗi của tôi. Tôi đã sửa chữa trong câu trả lời, họ phải nhất quán trong khi cổng thực tế có thể thay đổi. – junjiah