使用Lucene對建立的索引進行搜尋

2023-07-16 13:36:03

搜尋中要到的類不多：

package org.apache.lucene.searcher; import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Document; import org.apache.lucene.index.IndexReader; import org.apache.lucene.indexer.Indexer; import org.apache.lucene.queryParser.ParseException; import org.apache.lucene.queryParser.QueryParser; import org.apache.lucene.search.IndexSearcher; import org.apache.lucene.search.Query; import org.apache.lucene.search.ScoreDoc; import org.apache.lucene.search.TopDocs; import org.apache.lucene.store.Directory; import org.apache.lucene.store.FSDirectory; import org.apache.lucene.util.Version; public class Searcher { public static void main(String[] args) throws Exception { if(args.length != 3) { throw new Exception("Usage: java"+Indexer.class.getName() +"<index dir> <string> <query>"); } //存放索引的目錄 String indexDir = args[0]; //查詢部分，比如在内容中查詢，在目錄中查詢 String s = args[1]; //要查詢字元串 String query = args[2]; search(indexDir,s,query); } private static void search(String indexDir, String s, String query) throws IOException, ParseException { //打開存放索引的目錄 Directory dir = FSDirectory.open(new File(indexDir)); IndexReader reader = IndexReader.open(dir); IndexSearcher is = new IndexSearcher(reader); //參數為Lucene版本，要查詢的部分，标準分詞器 QueryParser parser = new QueryParser(Version.LUCENE_35, s, new StandardAnalyzer(Version.LUCENE_35)); Query q = parser.parse(query); long start = System.currentTimeMillis(); //獲得查詢結果，每頁顯示10個記錄 TopDocs hits = is.search(q, 10); System.out.println("Found"+hits.totalHits); long end = System.currentTimeMillis(); System.out.println("search use "+(end-start)+" milliseconds"); for(int i=0; i<hits.scoreDocs.length; i++) { //ScoreDoc從hits中擷取一條記錄 ScoreDoc scoreDoc = hits.scoreDocs[i]; //Returns the stored fields of document i //scoreDoc:比對的文檔id Document document = is.doc(scoreDoc.doc); System.out.println(document.get("filename")); } //關閉搜尋 is.close(); } }

在項目中，一般reader做成單例，那麼就需要改動代碼：

IndexSearch is = getSearcher(); is.close(); public IndexSearcher getSearcher() { try { if(reader == null) { reader = IndexReader.open(directory); } else { IndexReader tr = IndexReader.openIfChanged(reader); if(tr != null) { reader.close(); reader = tr; } } return new IndexSearcher(reader); } catch (CorruptIndexException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } return null; }實驗結果：

Found3 search use 14 milliseconds D:\abc\lucene\abc.txt D:\abc\lucene\hello.txt D:\abc\lucene\car.txt

以上類中用到的一些類的介紹：

IndexSearcher來搜尋IndexWriter建立的索引，當做一個類以隻讀方式打開一個索引。

Term由一系列字元串元素組成

Query是一個通用抽象父類，它包含了一些工具方法，其中有一個方法為setBoost

（float）確定Lucene搜尋的結果同使用者搜尋關鍵字更比對

TermQuery是Query的一個子類，它用來比對包含特殊值的文檔

TopDocs為搜尋後傳回的結果

這個類顯示了N個排序在前面的結果

使用Lucene對建立的索引進行搜尋

繼續閱讀

HDU 1067（HASH + BFS）

HDU 1067 HASH判重BFS

POJ-2046---Gap （bfs+hash)

hdu 1067(bfs+hash判重)Gap

hdu 5487 Difference of Languages BFS Difference of Languages

oracle 中不使用已有的索引解決辦法

【Python】Qt國際化ts檔案轉excel檔案（xml轉excel）

lucene 關鍵字高亮

對first_name建立唯一索引uniq_idx_firstname問題描述Sql語句

Unable to resolve dependency for ':app@debug/compileClasspath': Could not resolve com.android.suppo

Java網絡程式設計-Socket程式設計初涉七（UDP協定，簡易提供-搜尋服務）

HDU 2533 N皇後問題（搜尋）

記一次因MySQL編碼問題導緻的慢查詢排查

如何下載下傳blob:https://www.bilibili.com/的視訊

BZOJ3643 Phi的反函數（數論+搜尋）

專家訪談：搜尋開源力量：Lucene技術前景