最近两天看了下lucene的源码,印象还停留在2.x版本,现在都4.8了,变化不小,不过换汤不换药,还是比较容易理解的。
其实关于全文检索的倒排序,逻辑是非常简单的,“空间换时间”的概念也不复杂。
写了一段示意代码,说明一下。
以下的示意代码,采用mysql作为索引文件的存储介质。
使用“二元切分”,亦即“二元” “元切” “切分”。
最近两天看了下lucene的源码,印象还停留在2.x版本,现在都4.8了,变化不小,不过换汤不换药,还是比较容易理解的。
其实关于全文检索的倒排序,逻辑是非常简单的,“空间换时间”的概念也不复杂。
写了一段示意代码,说明一下。
以下的示意代码,采用mysql作为索引文件的存储介质。
使用“二元切分”,亦即“二元” “元切” “切分”。