天天看点

100行实现全文检索

最近两天看了下lucene的源码,印象还停留在2.x版本,现在都4.8了,变化不小,不过换汤不换药,还是比较容易理解的。

其实关于全文检索的倒排序,逻辑是非常简单的,“空间换时间”的概念也不复杂。

写了一段示意代码,说明一下。

以下的示意代码,采用mysql作为索引文件的存储介质。

使用“二元切分”,亦即“二元” “元切” “切分”。