Tôi đang gặp sự cố khi phân tách dấu chấm câu từ chỉ mục solr Khi dấu câu theo sau ngay từ sau thì từ này không được lập chỉ mục đúng cách.Solr: dấu chấm câu trước chỉ mục
Ví dụ: nếu chúng tôi lập chỉ mục "hello, John", nội dung sẽ không được tìm thấy theo từ khóa "hello" trong khi sẽ không có vấn đề gì nếu chúng tôi xóa dấu phẩy sau từ "hello".
Có bộ lọc nào mà nhà máy lọc giả sử dụng để bỏ dấu chấm câu không? Bất kỳ ý tưởng?
Cảm ơn, Bogdan.
Đối với những người có trường hợp cạnh như tôi: Các generateWordParts = 1 sẽ làm việc bình thường, nhưng nếu bạn đang làm gì tôi đang làm, nó sẽ không: Tôi đang sử dụng 'type' thuộc tính của WDFF để ánh xạ. và $ đến ALPHA, để tôi có thể đối sánh các cụm từ như '$ 10,00'. Điều này có tác dụng phụ tiêu cực gây ra tiền tố và hậu tố giai đoạn được bao gồm như một phần của từ. Vì vậy, trong trường hợp của tôi câu trả lời của @claytron có thể phù hợp hơn. –