ES Java 用戶端

标簽（空格分隔）： ES

Java 用戶端

節點用戶端(node client)：

節點用戶端本身也是一個ES節點(一般不儲存資料，不能成為主節點)，它能以無資料節點身份加入到叢集中。因為它是叢集環境中的一個節點，是以它知道整個叢集狀态(所有節點駐留，分片分布在哪些節點等等)，可以把需要執行的操作自動路由到節點上，而少一個網絡躍點。

Node node =  NodeBuilder.nodeBuilder().local(true).node() ;
Client client = node.client();
GetResponse getResponse = client.prepareGet(index, type, "2").get();
System.out.println(JSONObject.toJSONString(getResponse));

當你啟動node時，你可以在你的項目/src/main/resources/elasticsearch.yml檔案中定義簡單的設定cluster.name或者明确地使用clusterName方法來加入到指定的叢集中。

使用elasticsearch.yml的方式

cluster.name: yourclustername

通過Java的方式

Node node =  NodeBuilder.nodeBuilder().clusterName("elasticsearch").local(true).node() ;

使用節點用戶端的好處是，操作可以自動地路由到這些操作被執行的節點，而不需要執行雙跳(double hop)。例如，索引操作将會在該操作最終存在的分片上執行。

當你啟動了一個節點，最重要的決定是它是否将保有資料。大多數情況下，我們僅僅需要用到clients，而不需要分片配置設定給它們。這可以通過設定node.data為false或者設定node.local為true來簡單實作。

Node node =  NodeBuilder.nodeBuilder().local(true).node() ;
Client client = node.client();

傳輸用戶端(Transport Client)

作為更輕量的傳輸用戶端能夠請求到遠端叢集。它自己不加入叢集，隻是簡單的獲得一個或者多個初始化的transport位址，并以輪詢的方式與這些位址進行通信。比較像傳統的CS程式的架構，比如資料庫連接配接。

Settings settings = Settings.builder().put("cluster.name", "my-application").build();
TransportClient transportClient = TransportClient.builder()
  .settings(settings)
  .build()
  .addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("XXX.XXX.XXX.XXX"),   9300));

傳輸用戶端可以嗅到叢集的其他部分，并将它們加入到機器清單。為了開啟該功能，可以設定

client.transport.sniff

為true。

其他的transfersport用戶端設定有如下幾個：

Parameter	Description
client.transport.ignore_cluster_name	true：忽略連接配接節點的叢集名驗證
client.transport.ping_timeout	ping一個節點的響應時間，預設是5s
client.transport.nodes_sampler_interval	sample/ping 節點的時間間隔，預設是5s

節點用戶端與傳輸用戶端的差別

第一種方式，相當于額外啟動了一個ES的node節點，這個節點和叢集中的其他節點沒有任何差別。隻是這個node是由我們編碼控制的，可以設定這個node是不存資料的節點(沒有特殊原因你就應該這個設定)。
第二種方法，相當于擷取了所有node節點的client，發送請求的時候周遊目前可用的client(這裡可用指的是可以連接配接，但是node本身不一定可用，比如node正在恢複中，還沒有加入到叢集，這就會産生問題。)跟方法一相比，方法二會産生雙跳(double hop)，即目前周遊到node1，但通路的資料在node2，請求先轉發到node1，又由node1轉發到node2。
周遊方式：每次請求通過AtomicInteger進行原子加1(超過最大值後設定為0)，按目前可用client數取模。
擷取目前可用client的方法：使用線程池，周遊目前可用client，如果client未連接配接，嘗試進行一次連接配接，連接配接成功加入可用client中，如果client已經連接配接直接加入可用client。
可以通過設定client.transport.sniff是否為true，來設定是使用SimpleNodeSampler還是SniffNOdesSampler，預設是false，就是使用SimpleNodeSampler。具體實作在 org.elasticsearch.client.transport.TransportClientNodesService 中。
簡單的說，SimpleNodeSampler會限制目前可用client一定是在配置中設定的節點。而SniffNodesSampler會使用所有發現的client，即使這個client的node，不在配置中。
當叢集中某個node挂掉之後，重新加入的時候，因為是通過判斷client是否可以連接配接，而不是node是否可用，這會導緻這個時候使用這個client發送請求的時候産生異常。而方法一不會，因為還沒加入叢集的node，對于自己建立的node來說是不可見的。

使用情況

如果要将應用程式和Elasticsearch叢集進行解耦，傳輸用戶端是一個理想的選擇。例如如果你的應用程式需要快速的建立和銷毀到叢集的連結，傳輸用戶端比節點用戶端更"輕"，因為它不是叢集的

參考文檔

Elasticsearch: 權威指南

elasticsearch 2種用戶端的差別

用戶端