Linux和Windows下elasticsearch安裝和使用ik分詞器

2023-07-03 13:00:45

下載下傳IK分詞器：https://github.com/medcl/elasticsearch-analysis-ik/releases

必須跟elasticsearch版本一緻，可以選擇版本下載下傳，沒有對應版本可以翻頁找找看

開始安裝

Windows下安裝：

1.在elasticsearch的plugins目錄下建立名為ik的目錄；

2.再将下載下傳的elasticsearch-analysis-ik-7.6.2.zip壓縮包解壓到這個新建立的ik目錄下，隻需要elasticsearch-analysis-ik-7.6.2.zip下的内容，不需要再生成一個elasticsearch-analysis-ik-7.6.2檔案夾，如圖所示：

Linux和Windows下elasticsearch安裝和使用ik分詞器

Linux下安裝同理：

單節點與Windows相同操作

叢集：

1.停止叢集中所有機器的elasticsearch程序，在所有機器上做這些操作：在elasticsearch的plugins目錄下建立名為ik的目錄，再将下載下傳的elasticsearch-analysis-ik-7.6.2.zip壓縮包複制到這個新建立的ik目錄下；

2.在elasticsearch-analysis-ik-7.6.2.zip所在檔案夾下，執行目錄unzip elasticsearch-analysis-ik-7.6.2.zip進行解壓；

3.确認elasticsearch-analysis-ik-7.6.2.zip已經複制到每個elasticsearch的plugins/ik目錄下并解壓後，将所有elasticsearch啟動；

elasticsearch head上測試：

POST desktop_message/_analyze

{
  "text": "我是測試分詞",
  "analyzer": "ik_max_word"
}

desktop_message為索引名稱

1、ik_max_word

會将文本做最細粒度的拆分，比如會将“中華人民共和國人民大會堂”拆分為“中華人民共和國、中華人民、中華、華人、人民共和國、人民、共和國、大會堂、大會、會堂等詞語。

2、ik_smart

會做最粗粒度的拆分，比如會将“中華人民共和國人民大會堂”拆分為中華人民共和國、人民大會堂。

結果：

{
  "tokens": [
    {
      "token": "我",
      "start_offset": 0,
      "end_offset": 1,
      "type": "CN_CHAR",
      "position": 0
    },
    {
      "token": "是",
      "start_offset": 1,
      "end_offset": 2,
      "type": "CN_CHAR",
      "position": 1
    },
    {
      "token": "測試",
      "start_offset": 2,
      "end_offset": 4,
      "type": "CN_WORD",
      "position": 2
    },
    {
      "token": "分詞",
      "start_offset": 4,
      "end_offset": 6,
      "type": "CN_WORD",
      "position": 3
    }
  ]
}

結果截圖：

Linux和Windows下elasticsearch安裝和使用ik分詞器

Linux和Windows下elasticsearch安裝和使用ik分詞器

繼續閱讀

【elasticsearch】The number of object passed must be even but was [1]1.概述

ElasticJob‐Lite：部署ElasticJob-Lite-UI

ElasticJob‐Lite：Simple作業

ElasticJob‐Lite：整合Spring Boot

跟據經緯度實作附近搜尋Java實作

【最新 v7.9】Elasticsearch的基本概念與配置

圖解elasticsearch的_source、_all、store和index

深入elasticsearch源碼之環境搭建

elasticsearch 的 Percolator操作

es使用項目中遇到的問題

15.profile-api

【轉】ElasticSearch是什麼以及應用場景

ElasticSearch是什麼以及應用場景ES是如何産生的？ES 基礎一網打盡ES特點和優勢為什麼要用ES？ES的應用場景是怎樣的？

延雲行業搜尋資料庫在大資料生态中位置和重要性大資料的挑戰大資料技術的現狀延雲行業搜尋資料庫

尚矽谷—韓順平—圖解 Java設計模式（結構型）（55～）

30天了解30種技術系列---(10)面向Cloud的搜尋引擎 ElasticSearch