天天看點

[ES]--入門筆記--ES中的核心概念

1、Near Reatime(NRT)

近實時,從寫入資料到可以被搜尋到會有一些延時,大概1秒左右,基于es執行搜尋和分析可以達到秒級

2、 Cluster

叢集,包含多個節點,每個節點屬于哪個叢集是通過配置叢集名稱決定的,預設叢集名稱是elasticsearch

3、Node

節點,叢集中的每個節點都有一個名稱,名稱預設是随機配置設定的。預設節點會加入“elasticsearch”叢集。

4、Document

文檔,es中最小的資料單元,通常用JSON資料結構表示。一個document就是一條資料

5、Field

字段,一個document中有多個field,每個field就是一個字段。

6、Index

索引,存放有相似結構的文檔資料。一個index中包含了很多類似或者相同的document

7、 Type

類型,每個index下有多個type,type是index中的邏輯資料分類,每個type下的document,都有相同的field

8、Shard

分片,單台機器存儲資料量是有限的,es可以将一個index下的資料分為多個shard,存儲在不同的機器上,橫向擴充,存儲更多的資料,而且可以讓搜尋,分析等操作分不到多個機器上去執行,提升吞吐量和性能。每個shard都是一個lucene index。

9、Replica

副本,每台機器都可能會不可用,此時shard上的資料就可能會丢失。是以可以為每個shard建立多個副本,保證在一個shard不可用時還可以使用副本,且保證資料不丢失,還能提升查詢性能。

注意:主分片的個數是在建立索引時定下的,不能修改,預設為5個,副本分片,可以随時修改,預設是1個。因為要保證高可用,是以每個分片的的主分片和副本分片不能在一台機器上,是以保證最小高可用配置,需要兩台伺服器。

    在ES中的Document相當與資料庫中的行,Type相當于資料庫中的表。Index相當于資料庫中庫。

繼續閱讀