天天看點

java B2B2C電子商務平台分析之十三-----Spring Cloud Zipkin

Zipkin是什麼

Zipkin分布式跟蹤系統;它可以幫助收集時間資料,解決在microservice架構下的延遲問題;它管理這些資料的收集和查找;Zipkin的設計是基于谷歌的Google Dapper論文。願意了解源碼的朋友直接求求交流分享技術:二一四七七七五六三三

每個應用程式向Zipkin報告定時資料,Zipkin UI呈現了一個依賴圖表來展示多少跟蹤請求經過了每個應用程式;如果想解決延遲問題,可以過濾或者排序所有的跟蹤請求,并且可以檢視每個跟蹤請求占總跟蹤時間的百分比。

為什麼使用Zipkin

随着業務越來越複雜,系統也随之進行各種拆分,特别是随着微服務架構和容器技術的興起,看似簡單的一個應用,背景可能有幾十個甚至幾百個服務在支撐;一個前端的請求可能需要多次的服務調用最後才能完成;當請求變慢或者不可用時,我們無法得知是哪個背景服務引起的,這時就需要解決如何快速定位服務故障點,Zipkin分布式跟蹤系統就能很好的解決這樣的問題。

Zipkin原理

針對服務化應用全鍊路追蹤的問題,Google發表了Dapper論文,介紹了他們如何進行服務追蹤分析。其基本思路是在服務調用的請求和響應中加入ID,标明上下遊請求的關系。利用這些資訊,可以可視化地分析服務調用鍊路和服務間的依賴關系。

對應Dpper的開源實作是Zipkin,支援多種語言包括JavaScript,Python,Java, Scala, Ruby, C#, Go等。其中Java由多種不同的庫來支援

Spring Cloud Sleuth是對Zipkin的一個封裝,對于Span、Trace等資訊的生成、接入HTTP Request,以及向Zipkin Server發送采集資訊等全部自動完成。

Zipkin架構

跟蹤器(Tracer)位于你的應用程式中,并記錄發生的操作的時間和中繼資料,提供了相應的類庫,對使用者的使用來說是透明的,收集的跟蹤資料稱為Span;将資料發送到Zipkin的儀器化應用程式中的元件稱為Reporter,Reporter通過幾種傳輸方式之一将追蹤資料發送到Zipkin收集器(collector),然後将跟蹤資料進行存儲(storage),由API查詢存儲以向UI提供資料。

架構圖如下:

java B2B2C電子商務平台分析之十三-----Spring Cloud Zipkin

1.Trace

Zipkin使用Trace結構表示對一次請求的跟蹤,一次請求可能由背景的若幹服務負責處理,每個服務的處理是一個Span,Span之間有依賴關系,Trace就是樹結構的Span集合;

2.Span

每個服務的處理跟蹤是一個Span,可以了解為一個基本的工作單元,包含了一些描述資訊:id,parentId,name,timestamp,duration,annotations等。

3.Transport

收集的Spans必須從被追蹤的服務運輸到Zipkin collector,有三個主要的傳輸方式:HTTP, Kafka和Scribe;

4.Components

有4個元件組成Zipkin:collector,storage,search,web UI

collector:一旦跟蹤資料到達Zipkin collector守護程序,它将被驗證,存儲和索引,以供Zipkin收集器查找;

storage:Zipkin最初資料存儲在Cassandra上,因為Cassandra是可擴充的,具有靈活的模式,并在Twitter中大量使用;但是這個元件可插入,除了Cassandra之外,還支援ElasticSearch和MySQL;  存儲,zipkin預設的存儲方式為in-memory,即不會進行持久化操作。如果想進行收集資料的持久化,可以存儲資料在Cassandra,因為Cassandra是可擴充的,有一個靈活的模式,并且在Twitter中被大量使用,我們使這個元件可插入。除了Cassandra,我們原生支援ElasticSearch和MySQL。其他後端可能作為第三方擴充提供。

search:一旦資料被存儲和索引,我們需要一種方法來提取它。查詢守護程序提供了一個簡單的JSON API來查找和檢索跟蹤,主要給Web UI使用;

web UI:建立了一個GUI,為檢視痕迹提供了一個很好的界面;Web UI提供了一種基于服務,時間和注釋檢視跟蹤的方法。

整體代碼結構如下:

資料和源碼來源
java B2B2C電子商務平台分析之十三-----Spring Cloud Zipkin