elasticsearch 中文分詞器 elasticsearch-analysis-ik

2022-12-19 13:32:27

一、IK分詞器安裝

1、下載下傳位址：https://github.com/medcl/elasticsearch-analysis-ik/releases ，選擇和elasticsearch對應的版本elasticsearch-analysis-ik-5.4.0.zip，下載下傳并解壓。

2、在 elasticsearch-5.4.0/plugins/ 目錄下建立名為 ik 的檔案夾，拷貝elasticsearch-analysis-ik-5.4.0目錄下所有的檔案到 elasticsearch-5.4.0/plugins/ik/ 目錄下，然後重新開機elasticsearch服務。

3、啟動沒有報錯，并且看到日志資訊提示加載了插件 analysis-ik 表示安裝成功。

elasticsearch 中文分詞器 elasticsearch-analysis-ik

二、擴充本地詞庫

1、測試 analysis-ik 分詞:

http://localhost:9200/_analyze?analyzer=ik_smart&text=洪荒之力
結果：
{
    "tokens": [
        {
            "token": "洪荒",
            "start_offset": 0,
            "end_offset": 2,
            "type": "CN_WORD",
            "position": 0
        },
        {
            "token": "之力",
            "start_offset": 2,
            "end_offset": 4,
            "type": "CN_WORD",
            "position": 1
        }
    ]
}

我們可以看到預設的分詞器把“洪荒之力”分成了兩個詞，如果我們要讓分詞器把“洪荒之力”分成一個詞，我們可以設定本地字典。

2、在 elasticsearch-analysis-ik-5.4.0/config/custom/ 目錄下建立檔案 hotwords.dic（確定檔案的編碼方式為UTF-8，不然不生效）, 在檔案中添加詞語“洪荒之力”，每行一個詞，然後在ik分詞器的配置檔案（elasticsearch-analysis-ik-5.4.0/config/IKAnalyzer.cfg.xml）中指定新增的詞庫位置。然後重新開機elasticsearch伺服器生效詞庫。

再測試：

http://localhost:9200/_analyze?analyzer=ik_smart&text=洪荒之力
結果：
{
    "tokens": [
        {
            "token": "洪荒之力",
            "start_offset": 0,
            "end_offset": 4,
            "type": "CN_WORD",
            "position": 0
        }
    ]
}

elasticsearch 中文分詞器 elasticsearch-analysis-ik

繼續閱讀

k8s部署es叢集和kibana

ElasticSearch：部署ElasticSearch & Kibana

ES分詞插件IK Analyzer安裝

【elasticsearch】The number of object passed must be even but was [1]1.概述

跟據經緯度實作附近搜尋Java實作

【最新 v7.9】Elasticsearch的基本概念與配置

圖解elasticsearch的_source、_all、store和index

深入elasticsearch源碼之環境搭建

elasticsearch 的 Percolator操作

es使用項目中遇到的問題

15.profile-api

【轉】ElasticSearch是什麼以及應用場景

ElasticSearch是什麼以及應用場景ES是如何産生的？ES 基礎一網打盡ES特點和優勢為什麼要用ES？ES的應用場景是怎樣的？

延雲行業搜尋資料庫在大資料生态中位置和重要性大資料的挑戰大資料技術的現狀延雲行業搜尋資料庫

尚矽谷—韓順平—圖解 Java設計模式（結構型）（55～）

30天了解30種技術系列---(10)面向Cloud的搜尋引擎 ElasticSearch