es配置中文和拼音分詞器

2023-07-14 21:23:10

1.簡介

es預設使用standard分詞器 es還有其他分詞器比如simple  writespace language

2.配置中文分詞器(需先安裝git maven unzip)

git clone https://github.com/medcl/elasticsearch-analysis-ik.git
cd elasticsearch-analysis-ik
mvn package

mkdir /usr/local/elasticsearch/plugins/ik
mv target/releases/elasticsearch-analysis-ik-6.4.0.zip /usr/local/elasticsearch/plugins/ik
cd /usr/local/elasticsearch/plugins/ik
unzip elasticsearch-analysis-ik-6.4.0.zip

rm -rf elasticsearch-analysis-ik-6.4.0.zip

chown -R es:gp ik
./bin/elasticsearch -d

3.測試中文分詞器

# ik_max_word盡可能多切分單詞
GET _analyze
{
  "analyzer":"ik_max_word",
  "text":"阿裡巴巴"
}

ik_smart盡可能少切分單詞
GET _analyze
{
  "analyzer":"ik_smart",
  "text":"阿裡巴巴"
}

4.配置拼音分詞器

git clone https://github.com/medcl/elasticsearch-analysis-pinyin.git
cd elasticsearch-analysis-pinyin
mvn package

mkdir /usr/local/elasticsearch/plugins/pinyin
mv target/releases/elasticsearch-analysis-pinyin-6.4.0.zip /usr/local/elasticsearch/plugins/pinyin
cd /usr/local/elasticsearch/plugins/pinyin
unzip elasticsearch-analysis-pinyin-6.4.0.zip

rm -rf elasticsearch-analysis-pinyin-6.4.0.zip

chown -R es:gp pinyin
./bin/elasticsearch -d

5.測試拼音分詞器

GET _analyze
{
  "text": "阿裡巴巴",
  "analyzer": "pinyin"
}

es配置中文和拼音分詞器

繼續閱讀

ElasticSearch：部署ElasticSearch & Kibana

ES分詞插件IK Analyzer安裝

【elasticsearch】The number of object passed must be even but was [1]1.概述

跟據經緯度實作附近搜尋Java實作

【最新 v7.9】Elasticsearch的基本概念與配置

圖解elasticsearch的_source、_all、store和index

深入elasticsearch源碼之環境搭建

Ubuntu安裝JDK1.5

elasticsearch 的 Percolator操作

es使用項目中遇到的問題

15.profile-api

【轉】ElasticSearch是什麼以及應用場景

ElasticSearch是什麼以及應用場景ES是如何産生的？ES 基礎一網打盡ES特點和優勢為什麼要用ES？ES的應用場景是怎樣的？

延雲行業搜尋資料庫在大資料生态中位置和重要性大資料的挑戰大資料技術的現狀延雲行業搜尋資料庫

尚矽谷—韓順平—圖解 Java設計模式（結構型）（55～）

30天了解30種技術系列---(10)面向Cloud的搜尋引擎 ElasticSearch