天天看点

Lucene的学习第七篇——Lucene开发的lukeall的使用

入门代码的再学习后,前面的内容应该明白,理解80%以上,这里介绍lukeall的使用。Lukeall就是lucene开发必备的,lukeall我从两个方面介绍:

1:lukeall是什么?

2:lukeall怎么用?

先说上次遗留两个问题:

1:默认么排序的?

2:我们只是能够搜索这个spring.txt文档,怎么实现搜索“全文”,搜索到“全文检索.txt

如果我们能打开索引文件,查看索引库是怎么存放的。那么就明白了,看看怎么排序,哪些语汇单元,以及他们的索引。

这个文件打开,需要我们的lukeall工具。

这就解决了lukeall是什么问题。

 下面介绍lukeall怎么用:

Lukeall是lucene的索引查看工具,是一个jar包。

Lucene的学习第七篇——Lucene开发的lukeall的使用

第一个jar是IK分词器(后面介绍)

运行lukeall(运行jar包的通用方法)

第一步:

准备lukeall jar包(与lucene的版本一致,否则,会报异常)

将lukeall跟分词器放到一起

第二步:运行

cmd 运行黑窗口,输入命令:

java -jar lukeall-4.10.3.jar如果:运行lukeall,如果需要加载第三方分词器,需通过-Djava.ext.dirs加载jar包:可简单的将第三方分词器和lukeall放在一块儿,cmd下运行:

java -Djava.ext.dirs=. -jar lukeall-4.10.3.jar

执行结果:

Lucene的学习第七篇——Lucene开发的lukeall的使用

第三步:

1, 选择到索引库所在的目录,

2, 点击ok打开

Lucene的学习第七篇——Lucene开发的lukeall的使用

-

Lucene的学习第七篇——Lucene开发的lukeall的使用

域:

-

Lucene的学习第七篇——Lucene开发的lukeall的使用

四个域:

右边每一行:就是 一个域中的一个term。每个term中,包含:出现的次数,域名,term的内容。

所以到这里:

搞明白了三个问题:

- :不同的域中分出来的相同的单词,是不同的语汇单元,
 - :term的默认排序,就是按照每个term出现的次数,
   3:我们不能根据“全文”,或者是“全文检“,搜索到文档,是因为没有这样的内容的term,
   (显示的是文档的内容是一个汉字,分成了一个term)
           
Lucene的学习第七篇——Lucene开发的lukeall的使用

6个文档,0-5;

文档的四个域:

内容没有储存:所以显示的是空

名字,路径,大小,都有存。

根据介绍的

子类域和代码 进行一一比对,就明白了。

返回lucene/slor文章的目录:http://blog.csdn.net/m15517986455/article/details/78986856

继续阅读