天天看點

elasticsearch插件六—— 分詞 IK analyzer插件安裝詳解一、 IK Analyzer 介紹二、IK analyzer 安裝步驟

一、 IK Analyzer 介紹

IK Analyzer是一個開源的,基于Java語言開發的輕量級的中文分詞工具包,最初的時候,它是以開源項目Lucene為應用主體的,結合詞典分詞和文法分析算法的中文分詞元件,從3.0版本之後,IK逐漸成為面向java的公用分詞元件,獨立于Lucene項目,同時提供了對Lucene的預設優化實作,IK實作了簡單的分詞 歧義排除算法,标志着IK分詞器從單純的詞典分詞向模拟語義分詞衍化。

當安裝完Elasticsearch之後,預設已經含有一個分詞法,就是standard,這個分詞法對英文的支援還可以,但是對中文的支援非常差勁,如圖所示:

elasticsearch插件六—— 分詞 IK analyzer插件安裝詳解一、 IK Analyzer 介紹二、IK analyzer 安裝步驟

二、IK analyzer 安裝步驟

第一步:新增maven到yum libraries。

wget

http://repos.fedorapeople.org/repos/dchen/apache-maven/epel-apache-maven.repo

-O /etc/yum.repos.d/epel-apache-maven.repo

第二步:安裝maven

yum install apache-maven

檢視安裝後結果:

[elasticsearch@5b9dbaaa148a elasticsearch]maven−versionbash:maven:commandnotfound[elasticsearch@5b9dbaaa148aelasticsearch]maven−versionbash:maven:commandnotfound[elasticsearch@5b9dbaaa148aelasticsearch] mvn -version

Apache Maven 3.3.9 (bb52d8502b132ec0a5a3f4c09453c07478323dc5; 2015-11-10T16:41:47+00:00)

Maven home: /usr/share/apache-maven

Java version: 1.7.0_71, vendor: Oracle Corporation

Java home: /usr/java/jdk1.7.0_71/jre

Default locale: en_US, platform encoding: UTF-8

OS name: “linux”, version: “3.13.0-39-generic”, arch: “amd64”, family: “unix”

第三步:下載下傳分詞插件,

位址:

https://github.com/medcl/elasticsearch-analysis-ik

第四步:解壓下載下傳包,并在解壓後的檔案下執行mvn package

執行完畢後(大約10分鐘左右)

在插件路徑下建立路徑:/data/elasticsearch/plugins/ik(這是我的路徑,根據配置可能你的會不同)。

第五步:将 targetreleases的包解壓壓縮包

然後,進入解壓的壓縮包裡面可以看到幾個jar包和配置檔案,将這些檔案拷貝到 /data/elasticsearch/plugins/ik(第四步路徑)下。

以下截圖即驗證分詞是否成功,成功後會有紅色标注結果。

elasticsearch插件六—— 分詞 IK analyzer插件安裝詳解一、 IK Analyzer 介紹二、IK analyzer 安裝步驟

示例參考位址:

,在

http://10.8.5.101:9200/_plugin/head/

“複合查詢”下一步一步操作即可。

官網參考:

附:分詞舉例——

标準分詞(elasticsearch 自帶)舉例:

http://10.8.5.101:9200/_analyze?analyzer=standard&pretty=true&text=helloworld%20%E6%B7%B1%E5%9C%B3%E5%B8%82%E5%8D%8E%E4%B8%BA%E7%A7%91%E6%8A%80

ik插件分詞舉例:

http://10.8.5.101:9200/_analyze?analyzer=ik&pretty=true&text=%E4%B8%AD%E5%9B%BD%E9%A9%BB%E6%B4%9B%E6%9D%89%E7%9F%B6%E9%A2%86%E4%BA%8B%E9%A6%86%E9%81%AD%E4%BA%9A%E8%A3%94%E7%94%B7%E5%AD%90%E6%9E%AA%E5%87%BB%20%E5%AB%8C%E7%8A%AF%E5%B7%B2%E8%87%AA%E9%A6%96

作者:銘毅天下

轉載請标明出處,原文位址:

http://blog.csdn.net/laoyang360/article/details/51472953