天天看點

ES Java 用戶端

标簽(空格分隔): ES

Java 用戶端

節點用戶端(node client):

節點用戶端本身也是一個ES節點(一般不儲存資料,不能成為主節點),它能以無資料節點身份加入到叢集中。因為它是叢集環境中的一個節點,是以它知道整個叢集狀态(所有節點駐留,分片分布在哪些節點等等), 可以把需要執行的操作自動路由到節點上,而少一個網絡躍點。

Node node =  NodeBuilder.nodeBuilder().local(true).node() ;
Client client = node.client();
GetResponse getResponse = client.prepareGet(index, type, "2").get();
System.out.println(JSONObject.toJSONString(getResponse));
           

當你啟動node時,你可以在你的項目/src/main/resources/elasticsearch.yml檔案中定義簡單的設定cluster.name或者明确地使用clusterName方法來加入到指定的叢集中。

  • 使用elasticsearch.yml的方式
cluster.name: yourclustername
           
  • 通過Java的方式
Node node =  NodeBuilder.nodeBuilder().clusterName("elasticsearch").local(true).node() ;
           

使用節點用戶端的好處是,操作可以自動地路由到這些操作被執行的節點,而不需要執行雙跳(double hop)。例如,索引操作将會在該操作最終存在的分片上執行。

當你啟動了一個節點,最重要的決定是它是否将保有資料。大多數情況下,我們僅僅需要用到clients,而不需要分片配置設定給它們。這可以通過設定node.data為false或者設定node.local為true來簡單實作。

Node node =  NodeBuilder.nodeBuilder().local(true).node() ;
Client client = node.client();
           

傳輸用戶端(Transport Client)

作為更輕量的傳輸用戶端能夠請求到遠端叢集。它自己不加入叢集,隻是簡單的獲得一個或者多個初始化的transport位址,并以輪詢的方式與這些位址進行通信。比較像傳統的CS程式的架構,比如資料庫連接配接。

Settings settings = Settings.builder().put("cluster.name", "my-application").build();
TransportClient transportClient = TransportClient.builder()
  .settings(settings)
  .build()
  .addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("XXX.XXX.XXX.XXX"),   9300));
           

傳輸用戶端可以嗅到叢集的其他部分,并将它們加入到機器清單。為了開啟該功能,可以設定

client.transport.sniff

為true。

其他的transfersport用戶端設定有如下幾個:

Parameter Description
client.transport.ignore_cluster_name true:忽略連接配接節點的叢集名驗證
client.transport.ping_timeout ping一個節點的響應時間,預設是5s
client.transport.nodes_sampler_interval sample/ping 節點的時間間隔,預設是5s

節點用戶端與傳輸用戶端的差別

  1. 第一種方式,相當于額外啟動了一個ES的node節點,這個節點和叢集中的其他節點沒有任何差別。隻是這個node是由我們編碼控制的,可以設定這個node是不存資料的節點(沒有特殊原因你就應該這個設定)。
  2. 第二種方法,相當于擷取了所有node節點的client,發送請求的時候周遊目前可用的client(這裡可用指的是可以連接配接,但是node本身不一定可用,比如node正在恢複中,還沒有加入到叢集,這就會産生問題。)跟方法一相比,方法二會産生雙跳(double hop),即目前周遊到node1,但通路的資料在node2,請求先轉發到node1,又由node1轉發到node2。
  3. 周遊方式:每次請求通過AtomicInteger進行原子加1(超過最大值後設定為0),按目前可用client數取模。
  4. 擷取目前可用client的方法:使用線程池,周遊目前可用client,如果client未連接配接,嘗試進行一次連接配接,連接配接成功加入可用client中,如果client已經連接配接直接加入可用client。
  5. 可以通過設定client.transport.sniff是否為true,來設定是使用SimpleNodeSampler還是SniffNOdesSampler,預設是false,就是使用SimpleNodeSampler。具體實作在

    org.elasticsearch.client.transport.TransportClientNodesService

    中。
  6. 簡單的說,SimpleNodeSampler會限制目前可用client一定是在配置中設定的節點。而SniffNodesSampler會使用所有發現的client,即使這個client的node,不在配置中。
  7. 當叢集中某個node挂掉之後,重新加入的時候,因為是通過判斷client是否可以連接配接,而不是node是否可用,這會導緻這個時候使用這個client發送請求的時候産生異常。而方法一不會,因為還沒加入叢集的node,對于自己建立的node來說是不可見的。

使用情況

  • 如果要将應用程式和Elasticsearch叢集進行解耦,傳輸用戶端是一個理想的選擇。例如 如果你的應用程式需要快速的建立和銷毀到叢集的連結,傳輸用戶端比節點用戶端更"輕",因為它不是叢集的

參考文檔

  1. Elasticsearch: 權威指南
  2. elasticsearch 2種用戶端的差別
  3. 用戶端