入門代碼的再學習後,前面的内容應該明白,了解80%以上,這裡介紹lukeall的使用。Lukeall就是lucene開發必備的,lukeall我從兩個方面介紹:
1:lukeall是什麼?
2:lukeall怎麼用?
先說上次遺留兩個問題:
1:預設麼排序的?
2:我們隻是能夠搜尋這個spring.txt文檔,怎麼實作搜尋“全文”,搜尋到“全文檢索.txt
如果我們能打開索引檔案,檢視索引庫是怎麼存放的。那麼就明白了,看看怎麼排序,哪些語彙單元,以及他們的索引。
這個檔案打開,需要我們的lukeall工具。
這就解決了lukeall是什麼問題。
下面介紹lukeall怎麼用:
Lukeall是lucene的索引檢視工具,是一個jar包。

第一個jar是IK分詞器(後面介紹)
運作lukeall(運作jar包的通用方法)
第一步:
準備lukeall jar包(與lucene的版本一緻,否則,會報異常)
将lukeall跟分詞器放到一起
第二步:運作
cmd 運作黑視窗,輸入指令:
java -jar lukeall-4.10.3.jar如果:運作lukeall,如果需要加載第三方分詞器,需通過-Djava.ext.dirs加載jar包:可簡單的将第三方分詞器和lukeall放在一塊兒,cmd下運作:
java -Djava.ext.dirs=. -jar lukeall-4.10.3.jar
執行結果:
第三步:
1, 選擇到索引庫所在的目錄,
2, 點選ok打開
-
域:
-
四個域:
右邊每一行:就是 一個域中的一個term。每個term中,包含:出現的次數,域名,term的内容。
是以到這裡:
搞明白了三個問題:
- :不同的域中分出來的相同的單詞,是不同的語彙單元,
- :term的預設排序,就是按照每個term出現的次數,
3:我們不能根據“全文”,或者是“全文檢“,搜尋到文檔,是因為沒有這樣的内容的term,
(顯示的是文檔的内容是一個漢字,分成了一個term)
6個文檔,0-5;
文檔的四個域:
内容沒有儲存:是以顯示的是空
名字,路徑,大小,都有存。
根據介紹的
子類域和代碼 進行一一比對,就明白了。