天天看點

Elasticsearch Java API深入詳解

0、題記

之前Elasticsearch的應用比較多,但大多集中在關系型、非關系型資料庫與Elasticsearch之間的同步。以上内容完成了Elasticsearch所需要的基礎資料量的供給。但想要在海量的資料中找到和自己相關的業務資料,實作對已有的資料實作全文檢索、分類統計等功能并應用到業務系統中,必須借助Java API來實作。

1、Elasticsearch Java API 概覽

Elasticsearch Java API 相關使用研究結果:

1.1 國内的博文講解Elasticsearch Java API 大多偏重于實作,沒有對Elasticsearch Java API 整體進行講解。這樣的問題是頭疼醫頭,腳痛醫腳,始終不得原理。

1.2 Elasticsearch1.X,2.X,5.X随着版本的疊代,除了系統更新,Java API也做了相對較大的調整。

也就是說,1.X的API在2.X以及5.X乃至未來6.X版本都不是通用的。如1.x的fuzzyLikeThisQuery在後續版本都不再存在。

1.3 Elasticsearch官網Java API提供了相對豐富的解讀。(文末參考給出了官網位址)

1.4 Elasticsearch Java API 大緻分如下四類:

1.4.1 TransportClient

步驟1:擷取client;

步驟2:執行對應的增、删、改、查操作。

查詢使用參考(以下我已經驗證過,好用ok):

/**
* Query Search
* @param index
* @param type
* @param term
* @param queryString
*/
private static void querySearch(String index, String type,String term,String queryString){
Client client = createTransportClient();
SearchResponse response = client.prepareSearch(index)
  .setTypes(type)
  // 設定查詢類型
// 1.SearchType.DFS_QUERY_THEN_FETCH = 精确查詢
// 2.SearchType.SCAN = 掃描查詢,無序
// 3.SearchType.COUNT = 不設定的話,這個為預設值,還有的自己去試試吧
  .setSearchType(SearchType.DFS_QUERY_THEN_FETCH)
  // 設定查詢關鍵詞
  .setQuery(QueryBuilders.matchQuery(term, queryString))
  .addHighlightedField(term)
  .setHighlighterPreTags("<em>")
  .setHighlighterPostTags("</em>")
  // 設定查詢資料的位置,分頁用
.setFrom(0)
// 設定查詢結果集的最大條數
.setSize(60)
// 設定是否按查詢比對度排序
.setExplain(true)
// 最後就是傳回搜尋響應資訊
  .execute()
  .actionGet();
SearchHits searchHits = response.getHits();
System.out.println("-----------------在["+term+"]中搜尋關鍵字["+queryString+"]---------------------");
System.out.println("共比對到:"+searchHits.getTotalHits()+"條記錄!");
SearchHit[] hits = searchHits.getHits();
for (SearchHit searchHit : hits) {
//擷取高亮的字段
Map<String, HighlightField> highlightFields = searchHit.getHighlightFields();
HighlightField highlightField = highlightFields.get(term);
System.out.println("高亮字段:"+highlightField.getName()+"\n高亮部分内容:"+highlightField.getFragments()[0].string());
Map<String, Object> sourceAsMap = searchHit.sourceAsMap();
Set<String> keySet = sourceAsMap.keySet();
for (String string : keySet) {
//key value 值對應關系
System.out.println(string+":"+sourceAsMap.get(string));
}
System.out.println();
}
}           

1.4.2 RestClient

elasticsearch 5.0引入了一個新的用戶端 RestClient ,使用HTTP API elasticsearch代替内部協定。這需要更少依賴關系。你也不需要關注那麼多版本,目前用戶端也可以用于elasticsearch 2.x版本。

使用參考如下(以下我沒有代碼驗證):

HttpEntity entity = new NStringEntity(
      "{ \"query\": { \"match_all\": {}}}",
      ContentType.APPLICATION_JSON);
  // alternative: performRequestAsync
  Response response = restClient.performRequest("POST",                                     "/_search", emptyMap(), entity);
  String json = toString(response.getEntity());
  // ...           

1.4.3 Jest

Jest是ElasticSearch的Java HTTP Rest用戶端。 Jest填補了 ElasticSearch 缺少 Http Rest接口 用戶端的空白。

通過Maven編譯實作,需要設定好不同的版本。現在pom.xml最新的Elasticsearch版本為5.3.3(2017年5月27日),5.3.3的API向ES2.3.4插入索引資料,不能保障資料正常插入,且沒有報錯。

具體使用參考(以下示例跑通,驗證ok):

/**
* @brief:全文檢索入口
* @throws Exception
*/
private static void fullTextQuery(String queryString) throws Exception {
JestClient jestClient = JestExample.getJestClient();   //工廠模式實作
SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
searchSourceBuilder.query(QueryBuilders.queryStringQuery(queryString));

Search search = new Search.Builder(searchSourceBuilder.toString())
// .addIndex("article")
.build();
SearchResult result = jestClient.execute(search);
System.out.println(result.getJsonString());
}           

1.4.4 Spring Data Elasticsearch

這個,沒有深入研究。Spring Data Elasticsearch更适合于使用Spring資料庫的開發人員,并且不想直接與REST API接觸。附參考2有詳細介紹。

2、小結

1)以上API的調用方式各有利弊,具體根據開發實際情況做出選擇。

2)具體Java API的 TransportClient 方式與Jest方式的增、删、改、查操作,可以參考(下附4)。

3)ES的實踐開發還有很長的路要走,尤其分布式部署、原理、出現問題排查、高效檢索 Java API的運用等。

3、參考

1)、API對比:

http://blog.florian-hopf.de/2016/11/java-clients-elasticsearch.html

2)、官網API位址:

https://www.elastic.co/guide/en/elasticsearch/client/java-api/2.3/index.html

3)、Jest位址:

https://github.com/searchbox-io/Jest

4)、代碼示例:

https://github.com/ameizi/elasticsearch-jest-example

作者:銘毅天下

轉載請标明出處,原文位址:

http://blog.csdn.net/laoyang360/article/details/72793210