tôi sử dụng Solr cho các ứng dụng của tôi và tôi tích hợp các thành phần kiểm tra chính tả nhưng tôi có một số vấn đề:Solr Ý của bạn là (Kiểm tra chính tả thành phần)
Đầu tiên: Khi tôi gõ một thuật ngữ được phân cách bởi không gian mà họ cho tôi sửa chữa cho mỗi hạn
Ví dụ: "wat ters" =>"những gì thuật ngữ" nhưng đúng là Watters
thứ hai: Khi tôi gõ quá tôi cụm từ với một số hạn sai. mặc dù các điều khoản khác là chính xác nhưng họ áp dụng chính tả cho tất cả các điều khoản.
Ví dụ: "Difreences trong lankuage ước sử dụng" "Sự khác biệt trong sử dụng ngôn ngữ chuyển đổi" =>.
Sự thật là "Sự khác biệt trong quy ước sử dụng ngôn ngữ"
Đây là cấu hình của tôi trong solrconfig.xml:
<searchComponent name="spellcheck" class="solr.SpellCheckComponent">
<str name="queryAnalyzerFieldType">textSpell</str>
<lst name="spellchecker">
<str name="name">default</str>
<str name="field">spell</str>
<str name="spellcheckIndexDir">spellchecker</str>
</lst>
</searchComponent>
<requestHandler name="/spell" class="solr.SearchHandler" startup="lazy">
<lst name="defaults">
<str name="spellcheck.onlyMorePopular">true</str>
<str name="spellcheck.extendedResults">false</str>
<str name="spellcheck.count">1</str>
</lst>
<arr name="last-components">
<str>spellcheck</str>
</arr>
</requestHandler>
schema.xml:
loạiDòng:
<fieldType name="text" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="1" splitOnCaseChange="1"/>
<filter class="solr.ASCIIFoldingFilterFactory" />
<filter class="solr.SnowballPorterFilterFactory" language="English"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="0" generateNumberParts="0" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="0"/>
<filter class="solr.ASCIIFoldingFilterFactory" />
<filter class="solr.SnowballPorterFilterFactory" language="English"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/>
</analyzer>
<analyzer type="multiterm" >
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.ASCIIFoldingFilterFactory" />
</analyzer>
</fieldType>
<fieldType name="textSpell" class="solr.TextField" positionIncrementGap="100" omitNorms="true">
<analyzer type="index">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/>
<filter class="solr.StandardFilterFactory"/>
<filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/>
<filter class="solr.LowerCaseFilterFactory"/>
<!--<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>-->
<filter class="solr.StandardFilterFactory"/>
<filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
</analyzer>
</fieldType>
Fields:
<field name="title" type="text" indexed="true" stored="true" termVectors="true"/>
<field name="spell" type="textSpell" indexed="true" stored="true" multiValued="true"/>
Sao chép Fields
<copyField source="title" dest="spell"/>
tôi sẽ đánh giá cao sự giúp đỡ của bạn
Cheers
Câu hỏi hay ... bạn có bất kỳ hướng dẫn nào bạn đã sử dụng để tìm hiểu thêm về lucene ... khác thì tài liệu chính thức từ trang Solr không? Ty –
@Sebastian: ** Hướng dẫn cơ bản: ** [Solr trong 5 phút] (http://www.solrtutorial.com/solr-in-5-minutes.html), [Apache Lucene nhanh chóng khởi động hướng dẫn] (http://www.ibm.com/developerworks/opensource/tutorials/os-apachelucene/). ** Hướng dẫn nâng cao: ** [Hướng dẫn Dzone Solr] (http://www.dzone.com/links/search.html?query=solr+lucene&x=-1335&y=-4). Ví dụ **: ** [Solr Drupal cho Drupal] (https://drupal.org/project/apachesolr), [Apache Solr cho WordPress] (http://wordpress.org/plugins/solr- for-wordpress /), [Hướng dẫn sử dụng Solr Php] (http://php.net/manual/fr/book.solr.php). Chúc may mắn, tôi hy vọng nó giúp;) – ZendMind
** Sách: ** [Lucene và Solr: Hướng dẫn dứt khoát] (http://www.amazon.com/Lucene-Solr-Definitive-comprehensive-realtime/dp/1449359957/ref = sr_1_3? S = sách & tức là = UTF8 & qid = 1378896499 & sr = 1-3 & từ khóa = solr), [Apache Solr 4 Cookbook] (http://www.amazon.com/Apache-Solr-Cookbook-Rafal-Kuc/ dp/1782161325/ref = sr_1_1? s = sách & tức là = UTF8 & qid = 1378896499 & sr = 1-1 & keywords = solr). – ZendMind