天天看点

ElasticSearch常用的基于rest风格的搜索、过滤、分页、查询、高亮等操作

一、分词器使用

自带分词器:keyword,不会被分词

GET _analyze
{
  "analyzer": "keyword",
  "text": "我是程序员"
}
           

自带分词器:standard 标准分词 一个汉字/单词 是一个分词

GET _analyze
{
  "analyzer": "standard",
  "text": "我是程序员abc java"
}
           

ik分词器:ik_smart 为最少切分,智能划分

GET _analyze
{
  "analyzer": "ik_smart",
  "text": "我是程序员"
}
           

ik分词器:ik_max_word为最细粒度划分,词库的所有可能

GET _analyze
{
  "analyzer": "ik_max_word",
  "text": "我是程序员"
}
           

如果分词不符合实际业务,可以在config/IKAnalyzer.cfg.xml中自定义词库

二、索引操作

单纯建索引 并指定字段类型、分词器

PUT /product1
{
 "mappings": {
   "properties": {
     "skuId":{
       "type": "integer"
     },
     "skuName":{
       "type": "text",
       "analyzer": "ik_smart"
     },
     "unitPrice":{
       "type": "double"
     },
     "shopId":{
       "type":"keyword"
     },
     "shopName":{
       "type":"text"
     }
   }
 }
}
           

查询索引信息

GET /product1
           

删除索引

DELETE /product1
           

三、文档操作

PUT /indexName/typeName/docId 插入一条数据

如果索引不存在,会自动建一个索引,字段类型默认(字符串默认是keyword),并插入一条数据 注意观察结果的状态 版本号等

PUT /product/suk/9100-51000
{
  "skuId":51000,
  "skuName":"iphone 512G 16c read",
  "unitPrice":8000.00,
  "shopId":"9100",
  "count":210,
  "tags": ["手机","苹果","测试"]
}
           

修改文档方式一

put修改数据 这是以前的方式,缺点漏掉的字段会被删除

PUT /product/suk/9100-51000
{
  "count":15
}
           

修改文档方式二

推荐的修改方式 修改部分字段

POST /product/suk/9100-51000/_update
{
  "doc":{
      "count":2110
  }
}
           

简单查询:通过id查询

GET /product/suk/9100-51004
           

简单查询:通过条件查询

GET /product/suk/_search?q=shopId:9100
GET /product/_search?q=skuName:128G
GET /product/_search?q=tags:测试
           

复杂查询:匹配、指定字段、排序、分页

match按照分词的结果查询,使用分词器,如果没有这个分词,查不到。match中只能放置一个字段

source指定查询字段

sort 排序

分页 from(从0开始) size

GET /product/_search
{
  "query": {
    "match": {
      "skuName": "black"
    }
  },
  "_source": ["unitPrice","shopId"],
  "sort": [
    {
      "unitPrice": {
        "order": "desc"
      }
    }
  ],
  "from": 2,
  "size": 2
}  
           

复杂查询:多字段查询 使用 bool

match中也只能单字段

must是and should是or must_not是同时不满足

GET /product/_search
{
  "query": {
    "bool": {
      "must_not": [
        {
          "match": {
            "skuName": "black"
          }
        },
        {
          "match": {
            "count":60
          }
        }
      ]
    }
  }
} 
           

复杂查询:多字段查询 filter过滤数据

GET /product/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "match": {
            "skuName": "black"
          }
        }
      ],
      "filter": {
        "range": {
          "count": {
            "gte": 10,
            "lte": 60
          }
        }
      }
    }
  }
} 
           

复杂查询:多个值匹配

查询skuName包含black或max或512的文档

GET /product/_search
{
  "query": {
    "match": {
      "skuName": "black max  512"
    }
  }
} 
           

复杂查询:多个值精确匹配 terms

term 直接使用倒排索引精确查询,效率高

match 先使用分词器解析,在对解析后的分词进行查询

字段类型text会被分词器解析,keywords不会被分词器解析是个整体

GET /product/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "terms": {
            "count": [60,67]
          }
        }
      ]
    }
  }
} 

GET /product/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "term": {
            "count":60
          }
        },
        {
          "term": {
            "count":67
          }
        }
      ]
    }
  }
} 
           

高亮

GET /product/_search
{
  "query": {
    "match": {
      "skuName": "black"
    }
  },
  "highlight": {
    "fields": {
      "skuName": {}
    }
  }
}  
           

自定义高亮

GET /product/_search
{
  "query": {
    "match": {
      "skuName": "black"
    }
  },
  "highlight": {
    "pre_tags": "<p class='key' style='color:red'>",
    "post_tags": "</p>", 
    "fields": {
      "skuName": {}
    }
  }
} 
           

继续阅读