天天看點

lucene分詞器與搜尋

一、分詞器

  lucene針對不同的語言和虛僞提供了許多分詞器,我們可以針對應用的不同的需求使用不同的分詞器進行分詞。我們需要注意的是在建立索引時使用的分詞器與搜尋時使用的分詞器要保持一緻。否則搜尋的結果就不是我們期望的結果。lucene提供的正常分詞器如下:

•StandardAnalyzer 标準分詞器

•IKAnalyzer 基于Lucene的第三方中文分詞技術

•WhitespaceAnalyzer 空格分詞器

•SimpleAnalyzer 簡單分詞器

•CJKAnalyzer 二分法分詞器

•KeywordAnalyzer 關鍵詞分詞器

•StopAnalyzer 被忽略詞分詞器

•FrenchAnalyzer 法國語言分詞

•GermanAnalyzer 德國語言分詞

•GreekAnalyzer 希臘語言分詞

•RussianAnalyzer 俄羅斯語言分詞

   相關分詞器示例如下:

  運作結果如下:

lucene分詞器與搜尋

 二、搜尋條件

  在有些應用場景中,我們需要在搜尋的時候,使用多個條件進行查詢。此時我們可以使用lucene提供的搜尋條件進行搜尋。如對多個域進行查詢、字首查詢、通配符查詢等。

  相關示查詢例如下:

lucene分詞器與搜尋

繼續閱讀