Lucene的学习第七篇——Lucene开发的lukeall的使用

2023-07-16 13:38:04

入门代码的再学习后，前面的内容应该明白，理解80%以上，这里介绍lukeall的使用。Lukeall就是lucene开发必备的，lukeall我从两个方面介绍：

1：lukeall是什么？

2：lukeall怎么用？

先说上次遗留两个问题：

1：默认么排序的？

2：我们只是能够搜索这个spring.txt文档，怎么实现搜索“全文”，搜索到“全文检索.txt

如果我们能打开索引文件，查看索引库是怎么存放的。那么就明白了，看看怎么排序，哪些语汇单元，以及他们的索引。

这个文件打开，需要我们的lukeall工具。

这就解决了lukeall是什么问题。

 下面介绍lukeall怎么用：

Lukeall是lucene的索引查看工具，是一个jar包。

Lucene的学习第七篇——Lucene开发的lukeall的使用

第一个jar是IK分词器（后面介绍）

运行lukeall（运行jar包的通用方法）

第一步：

准备lukeall jar包（与lucene的版本一致，否则，会报异常）

将lukeall跟分词器放到一起

第二步：运行

cmd 运行黑窗口，输入命令：

java -jar lukeall-4.10.3.jar如果：运行lukeall，如果需要加载第三方分词器，需通过-Djava.ext.dirs加载jar包:可简单的将第三方分词器和lukeall放在一块儿，cmd下运行：

java -Djava.ext.dirs=. -jar lukeall-4.10.3.jar

执行结果：

Lucene的学习第七篇——Lucene开发的lukeall的使用

第三步：

1，选择到索引库所在的目录，

2，点击ok打开

Lucene的学习第七篇——Lucene开发的lukeall的使用

域：

Lucene的学习第七篇——Lucene开发的lukeall的使用

四个域：

右边每一行：就是一个域中的一个term。每个term中，包含：出现的次数，域名，term的内容。

所以到这里：

搞明白了三个问题：

- :不同的域中分出来的相同的单词，是不同的语汇单元，
 - ：term的默认排序，就是按照每个term出现的次数，
   3：我们不能根据“全文”，或者是“全文检“，搜索到文档，是因为没有这样的内容的term,
   (显示的是文档的内容是一个汉字，分成了一个term)

Lucene的学习第七篇——Lucene开发的lukeall的使用

6个文档，0-5；

文档的四个域：

内容没有储存：所以显示的是空

名字，路径，大小，都有存。

根据介绍的

子类域和代码进行一一比对，就明白了。

Lucene的学习第七篇——Lucene开发的lukeall的使用

返回lucene/slor文章的目录：http://blog.csdn.net/m15517986455/article/details/78986856

继续阅读

解析pdf、word2003、Excel2003、word2007、Excel2007、PowerPoint、Text 可用于Lucene

eclipse中配置heritrix的图文过程----heritrix-1.14.3

Lucene 基本原理

ajax技术学习网址

Ajax学习--网址备忘录

开放源代码搜索引擎

转：基于lucene实现自己的推荐引擎

基于LUCENE实现自己的推荐引擎

Lucene.net和盘古分词使用小结

Apache Lucene 5.x 集成中文分词库 IKAnalyzer

JFLex用户手册中文版安装与配置运行JFLEX 配置文件编写

svn配置权限

MySQL和Lucene索引对比分析1. MySQL索引实现2. Lucene索引实现3. MySQL与Lucence对比参考：

Lucence的基本原理

lucene 关键字高亮

专家访谈：搜索开源力量：Lucene技术前景