天天看點

coreseek+mmseg實作中文分詞

在windows下實作中文分詞方法:

1,首先下載下傳mmseg,下載下傳位址:http://www.coreseek.cn/opensource/mmseg/;這裡我是将下載下傳的檔案解壓到e/mmseg下;

2,修改coreseek/bin/sphinx.conf裡的配置檔案:

charset_dictpath = e:\mmseg\data\

ngram_len=0    

    3,重新啟動coreseek即可!