一、 IK Analyzer 介紹
IK Analyzer是一個開源的,基于Java語言開發的輕量級的中文分詞工具包,最初的時候,它是以開源項目Lucene為應用主體的,結合詞典分詞和文法分析算法的中文分詞元件,從3.0版本之後,IK逐漸成為面向java的公用分詞元件,獨立于Lucene項目,同時提供了對Lucene的預設優化實作,IK實作了簡單的分詞 歧義排除算法,标志着IK分詞器從單純的詞典分詞向模拟語義分詞衍化。
當安裝完Elasticsearch之後,預設已經含有一個分詞法,就是standard,這個分詞法對英文的支援還可以,但是對中文的支援非常差勁,如圖所示:

二、IK analyzer 安裝步驟
第一步:新增maven到yum libraries。
wget
http://repos.fedorapeople.org/repos/dchen/apache-maven/epel-apache-maven.repo-O /etc/yum.repos.d/epel-apache-maven.repo
第二步:安裝maven
yum install apache-maven
檢視安裝後結果:
[elasticsearch@5b9dbaaa148a elasticsearch]maven−versionbash:maven:commandnotfound[elasticsearch@5b9dbaaa148aelasticsearch]maven−versionbash:maven:commandnotfound[elasticsearch@5b9dbaaa148aelasticsearch] mvn -version
Apache Maven 3.3.9 (bb52d8502b132ec0a5a3f4c09453c07478323dc5; 2015-11-10T16:41:47+00:00)
Maven home: /usr/share/apache-maven
Java version: 1.7.0_71, vendor: Oracle Corporation
Java home: /usr/java/jdk1.7.0_71/jre
Default locale: en_US, platform encoding: UTF-8
OS name: “linux”, version: “3.13.0-39-generic”, arch: “amd64”, family: “unix”
第三步:下載下傳分詞插件,
位址:
https://github.com/medcl/elasticsearch-analysis-ik第四步:解壓下載下傳包,并在解壓後的檔案下執行mvn package
執行完畢後(大約10分鐘左右)
在插件路徑下建立路徑:/data/elasticsearch/plugins/ik(這是我的路徑,根據配置可能你的會不同)。
第五步:将 targetreleases的包解壓壓縮包
然後,進入解壓的壓縮包裡面可以看到幾個jar包和配置檔案,将這些檔案拷貝到 /data/elasticsearch/plugins/ik(第四步路徑)下。
以下截圖即驗證分詞是否成功,成功後會有紅色标注結果。
示例參考位址:
,在
http://10.8.5.101:9200/_plugin/head/“複合查詢”下一步一步操作即可。
官網參考:
附:分詞舉例——
标準分詞(elasticsearch 自帶)舉例:
http://10.8.5.101:9200/_analyze?analyzer=standard&pretty=true&text=helloworld%20%E6%B7%B1%E5%9C%B3%E5%B8%82%E5%8D%8E%E4%B8%BA%E7%A7%91%E6%8A%80ik插件分詞舉例:
http://10.8.5.101:9200/_analyze?analyzer=ik&pretty=true&text=%E4%B8%AD%E5%9B%BD%E9%A9%BB%E6%B4%9B%E6%9D%89%E7%9F%B6%E9%A2%86%E4%BA%8B%E9%A6%86%E9%81%AD%E4%BA%9A%E8%A3%94%E7%94%B7%E5%AD%90%E6%9E%AA%E5%87%BB%20%E5%AB%8C%E7%8A%AF%E5%B7%B2%E8%87%AA%E9%A6%96作者:銘毅天下
轉載請标明出處,原文位址:
http://blog.csdn.net/laoyang360/article/details/51472953