Tôi có một loạt tài liệu văn bản mô tả bệnh tật. Những tài liệu này trong hầu hết các trường hợp khá ngắn và thường chỉ chứa một câu duy nhất. Một ví dụ được đưa ra ở đây:Bệnh có tên là nhận dạng đối tượng
Tăng huyết áp động mạch phổi nguyên phát là một bệnh tiến triển trong đó tắc mạch phổi nhỏ nhất dẫn đến tăng sức cản mạch phổi và thất bại thất bại sau đó.
Những gì tôi cần là một công cụ tìm tất cả các điều kiện bệnh (ví dụ "tăng huyết áp phổi" trong trường hợp này) trong các câu và bản đồ chúng vào một từ vựng được kiểm soát như MeSH.
Cảm ơn trước vì câu trả lời của bạn!
Điều đó nghe có vẻ rất cụ thể và không phải là vấn đề lập trình * mỗi lần *. Ít nhất là không được thể hiện ở đây. –
Dường như đây là câu hỏi khai thác dữ liệu nhiều hơn? – Harpal