目前Zeppelin官方已經釋出版本為0.7.3,源碼帶托管在Github上,大家可以先将Zeppelin的源碼在Github上下載下傳下來。Zeppelin的項目結構是以Maven的形式存在的,由多個Module構成,分為架構核心Module和其他Interpreter Module,源碼結構如下圖所示:

從截圖中可以看出,其實Zeppelin到目前為止,內建了很多插件,比如Beam、HBase、ES、Flink、Kylin、Pig等,這些都是平時大資料場景下常用的。
Zeppelin的入口是ZeppelinServer(在zeppelin-server子產品下)這個類下的Main函數,通過Jetty内嵌伺服器提供WebSocket服務和Restful服務,還基于Shiro提供了權限認證和使用者校驗功能,都是使用Java程式設計語言實作的。在zeppelin-zengine子產品下,實作Notebook的持久化和檢索功能,同樣使用Java語言實作。在zeppelin-interpreter子產品下,通過調用zeppelin-zengine中的Thrift服務,來實作解釋器的互動功能。在zeppelin-web子產品下,用于腳本語言編寫以及資料的可視化,使用AngularJS前端架構實作。其他子產品詳見下表。
名稱
說明
實作語言
zeppelin-server
整個系統入口,提供伺服器功能、權限認證以及使用者校驗等功能
Java
zeppelin-zengine
實作Zeppelin中Notebook的持久化和檢索功能
zeppelin-interpreter
執行解釋器
zeppelin-web
業務腳本語言編寫、資料分析界面、資料可視化與結果導出
AngularJS
zeppelin-display
讓前端的AngularJS元素與背景資料進行綁定,進行資料互動
Scala
zeppelin-distribution
用于存放編譯後的二進制安裝包
zeppelin-examples
示例代碼,用于測試
helium-dev
新特性,讓解釋器,存儲插件加入到Zeppelin中時,不需要重新開機Zeppelin服務
Zeppelin項目運用了許多程式設計語言和架構,屬于一個混合項目。
明白Zeppelin各個子產品的功能和作用後,我們可以嘗試去調試一下Zeppelin的源碼,這裡我們将Zeppelin的源碼導入到 IDEA 編輯器,然後找到ZeppelinServer啟動,如下圖所示:
然後選擇“Run 'ZeppelinServer.main()'”指令即可,等待服務啟動完成,啟動成功後,會在編輯器控制台列印日志,如下圖所示:
這裡,在啟動端口預設是8080,在ZeppelinConfiguration類下可以進行編輯,如下圖所示:
然後,我們可以到浏覽器預覽調試結果,如下圖所示:
一般在二次開發完成Zeppelin的功能後,我們會将源代碼重新編譯打包,可以使用Maven打包指令,如下所示:
打包完成後,會在zeppelin-distribution的target目錄下生成一個二進制的軟體安裝包。
這裡筆者給大家整理了Zeppelin-0.7.3的各個Module之間的關系圖,如下所示:
這篇部落格就和大家分享到這裡,如果大家在研究學習的過程當中有什麼問題,可以加群進行讨論或發送郵件給我,我會盡我所能為您解答,與君共勉。
<b></b><b></b><b></b><b></b>
聯系方式:
溫馨提示:請大家加群的時候寫上加群理由(姓名+公司/學校),友善管理者稽核,謝謝!