天天看点

[ES]--入门笔记--ES中的核心概念

1、Near Reatime(NRT)

近实时,从写入数据到可以被搜索到会有一些延时,大概1秒左右,基于es执行搜索和分析可以达到秒级

2、 Cluster

集群,包含多个节点,每个节点属于哪个集群是通过配置集群名称决定的,默认集群名称是elasticsearch

3、Node

节点,集群中的每个节点都有一个名称,名称默认是随机分配的。默认节点会加入“elasticsearch”集群。

4、Document

文档,es中最小的数据单元,通常用JSON数据结构表示。一个document就是一条数据

5、Field

字段,一个document中有多个field,每个field就是一个字段。

6、Index

索引,存放有相似结构的文档数据。一个index中包含了很多类似或者相同的document

7、 Type

类型,每个index下有多个type,type是index中的逻辑数据分类,每个type下的document,都有相同的field

8、Shard

分片,单台机器存储数据量是有限的,es可以将一个index下的数据分为多个shard,存储在不同的机器上,横向扩展,存储更多的数据,而且可以让搜索,分析等操作分不到多个机器上去执行,提升吞吐量和性能。每个shard都是一个lucene index。

9、Replica

副本,每台机器都可能会不可用,此时shard上的数据就可能会丢失。因此可以为每个shard建立多个副本,保证在一个shard不可用时还可以使用副本,且保证数据不丢失,还能提升查询性能。

注意:主分片的个数是在建立索引时定下的,不能修改,默认为5个,副本分片,可以随时修改,默认是1个。因为要保证高可用,所以每个分片的的主分片和副本分片不能在一台机器上,所以保证最小高可用配置,需要两台服务器。

    在ES中的Document相当与数据库中的行,Type相当于数据库中的表。Index相当于数据库中库。

继续阅读