Elasticsearch 設定預設值的三種方式

2、Elasticsearch Mapping 層面預設值

認知前提：嚴格講 Elasticsearch 是不支援 Mapping 層面設定資料類型的時候，設定字段的預設值的。

有人會說，null value 設定算不算？不算。

大家看一下：

PUT my-index-000001

{

"mappings": {

"properties": {

"status_code": {

"type": "keyword",

"null_value": "NULL"

}

null_value 的本質是将“NULL” 替換 null 值，以使得空值可被索引或者檢索。

我們期望設定 Mapping 的時候，可以對各種資料類型添加一個任意指定的預設值。但是 Elasticsearch Mapping 層面不支援，咋辦？

隻能去尋找其他的方案。

3、曲線救國實作 Elasticsearch 設定預設值

直接給出答案，共三種設定預設值的。

3.1 方案一：pipeline 設定預設值

# 建立 append 管道

PUT _ingest/pipeline/add_default_pipeline

"processors": [

{

"set": {

"field": "sale_count",

"value": 1

]

# 建立索引

PUT customer

"mappings":{

"properties":{

"sale_count":{

"type":"integer"

"major":{

"type":"keyword",

"null_value": "NULL"

"settings": {

"index":{

"default_pipeline":"add_default_pipeline"

插入資料，驗證一把：

POST customer/_doc/1

"major":null

傳回結果：

"max_score" : 1.0,

"hits" : [

{

"_index" : "customer",

"_type" : "_doc",

"_id" : "1",

"_score" : 1.0,

"_source" : {

"major" : null,

"sale_count" : 1

}

]

以上的方式，實作了sale_count 的預設值為1 的設定。

是借助索引設計層面在 setting 中關聯 default_pipeline 實作的。

實作方式相對簡單，能保證使用者在設定索引的前提下，使用者隻關注寫入資料，其他背景預處理管道幫助實作細節。

引申一下，針對開篇提到的第二個問題：

create_time 借助 pipeline 管道預處理 set processor 實作即可。

PUT _ingest/pipeline/create_time_pipeline

"description": "Adds create_time timestamp to documents",

"field": "_source.create_time",

"value": "{{_ingest.timestamp}}"

DELETE my_index_0003

PUT my_index_0003

"settings": {

"index.default_pipeline": "create_time_pipeline"

}

POST my_index_0003/_doc/1

{}

GET my_index_0003/_search

update_time 自己維護更新，業務更新的時刻通過代碼或者腳本加上時間戳就可以。

3.2 方案二：update_by_query 通過更新添加預設值

POST customer/_doc/2

# 批量更新腳本

POST customer/_update_by_query

"script": {

"lang": "painless",

"source": "if (ctx._source.major == null) {ctx._source.major = 'student'}"

POST customer/_search

結果是：

所有 major 為 null 的，都實作了更新，設定成了：“student"。

該方式屬于先寫入資料，然後實作資料層面的更新，算作設定預設值甚至都有點勉強。

3.3 方案三：借助 pipeline script 更新

PUT _ingest/pipeline/update_pipeline

"script": {

"lang": "painless",

"source": """

if (ctx['major'] == null) {ctx['major'] = 'student'}

"""

POST customer/_doc/4

POST customer/_update_by_query?pipeline=update_pipeline

"query": {

"match_all": {}

結果是：同方案二，也實作了更新。

該方案是第二種方案的内卷版本，本質實作基本一緻。

強調細節不同點，ctx 取值的時候，細節文法不一樣：

腳本script 操作，通路方式：ctx._source.major。

pipeline 預處理腳本操作：通路方式：ctx['major'] 。

4、小結

本文講解了 Elasticsearch 實作類關系型資料庫預設值的三種方案，隻有第一種屬于前置設定預設值。

後兩種都是先寫入後設定預設值的腳本更新實作方案。實戰方案選型，推薦方案一

Elasticsearch 設定預設值的三種方式

繼續閱讀

2022秋招面試總結（cpp+java+測開）百度測開一面位元組後端一面蝦皮後端一面蝦皮後端二面

資料庫之DDL操作資料庫DDL操作資料庫DDL操作資料表

資料庫之DQL操作資料庫

mysql優化（sql優化）

資料遷移方法資料遷移原則資料遷移之雙寫方案資料遷移之級聯同步方案

redis叢集資料一緻性_RedisRaft為Redis叢集帶來強大的資料一緻性

寶塔面闆mysql恢複2018.1.8更新

Centos7 MySQL 5.7 安裝MySQL 5.7 安裝

查找入職員工時間排名倒數第三的員工所有資訊

Hibernate使用Hibernate的“3個準備，7個步驟”Hibernate API簡介操作實體對象對象識别

雲計算面試題——mysql/存儲引擎/備份

SQL語言基礎：常用的資料查詢語句

Ubuntu16.04安裝Apache+MySQL+PHP1. 安裝Apache2. 安裝MySQL3. 安裝PHP4. 安裝phpMyAdmin

MySQL的4種隔離級别？出現問題

neo4j之cypher使用文檔

mysql使用source指令導入.sql檔案