天天看點

本地快速體驗 Kylin「分析篇」

「搭建篇」中李森輝為大家介紹了如何在自家電腦上快速搭建好 Apache Kylin 。通過 Kylin 自帶的簡單圖表展示來進行資料分析的你是否覺得還不夠過瘾?想在酷炫的儀表盤上進行資料分析?今天就給大家帶來一款上手較快,簡單易用的資料驅動式 Notebook 工具——Apache Zeppelin。将 Zeppelin 與Kylin 內建後,你就可以通過它來定制你的資料可視化報告,更直覺地體驗 Kylin 的分析“神”速啦~

與 Kylin 一樣, Apache Zeppelin 也是 Apache 軟體基金會的頂級項目,是一款基于 Web 的 Notebook(類似于 IPython 的 Notebook),支援互動式的資料分析,原生就支援 Spark、Scala、SQL、Shell、Markdown 等程式設計或腳本語言。通路其官方網站(https://zeppelin.apache.org)可了解更多的資訊。

本地快速體驗 Kylin「分析篇」

Apache Zeppelin

下載下傳與安裝

Zeppelin 也有一套類似 Kylin 的可插拔架構機制,為不同的程式設計或腳本語言提供對應的解釋器接口,實際使用過程中通過(%+解釋器名稱)來識别,是以在下載下傳頁面可看到有兩個不同的版本:

  • all 版本:軟體包裡面包含 Zeppelin 支援的所有程式設計語言的解釋器。
  • netinst 版本:軟體包裡面隻包含了 Spark、Shell  等基礎程式設計語言的解釋器,其它語言解釋器可按需安裝。netinst 的含義即是通過網絡安裝。

建議下載下傳 netinst 版本的軟體包,其它程式設計或腳本語言可通過插件安裝方式擴充,通過 SSH 終端工具上傳到虛拟電腦,或者直接在虛拟電腦上通過 wget/curl 指令下載下傳到本地。

然後,解壓 Zeppelin 軟體包到自定義的安裝目錄下面,進入到 conf 檔案夾下,将原有的 zeppelin-site.xml.template 配置檔案拷貝另存名稱為 zeppelin-site.xml 檔案。該檔案中主要包括 Zeppelin 服務相關的配置項,如對外通路端口預設為 8080,可修改成自定義的端口号,其它參數配置也可按實際情況進行修改。更加詳細的參數配置說明,可通路官方提供的說明(https://zeppelin.apache.org/docs/0.8.0/setup/operation/configuration.html)。完成配置參數自定義修改後,重新切換到  Zeppelin 安裝目錄,執行如下的指令,便以背景常駐形式啟動 Zeppelin 服務:

[[email protected] zeppelin-0.8.1-bin-netinst]$ bin/zeppelin-daemon.sh start

最後,打開浏覽器在位址欄中輸入:http://虛拟電腦IP位址:8080/,敲下Enter鍵,即可成功通路和使用 Zeppelin 服務。

內建 Apache Kylin

手動添加 Kylin 的解釋器,在 Zeppelin 的安裝目錄下執行如下的指令進行安裝操作,安裝完成後需要重新開機 Zeppelin 服務。

[[email protected] zeppelin-0.8.1-bin-netinst]$ bin/install-interpreter.sh –name kylin –artifact org.apache.zeppelin:zeppelin-kylin:0.8.1

[[email protected] zeppelin-0.8.1-bin-netinst]$ bin/zeppelin-daemon.sh restart

然後,對 Kylin 的解釋器進行相關配置,通過浏覽器通路并打開 Zeppelin Notebook 頁面,在頁面左上角的菜單進入到解釋器的配置頁面找到 Kylin 标題,将 Kylin REST API 相關的資訊進行配置,如 API 位址、使用者名、密碼等資訊,可參考下圖所示:

本地快速體驗 Kylin「分析篇」

Kylin 解釋器配置

最後,可建立一個簡單的 Notebook 進行初步的驗證。建立新的 Notebook 需要填充 2 個關鍵的參數:Note Name(支援目錄級建立),預設的解釋器類型(不需要添加 %+ 解釋器,這裡選取 kylin ),如下圖所示:

本地快速體驗 Kylin「分析篇」

建立 Notebook

接着在代碼段輸入查詢 SQL 語句,點選右上角的執行按鈕即可得到如下圖所示的結果:

本地快速體驗 Kylin「分析篇」

Kylin Query on Zeppelin

制作資料儀表盤

設計定制化的資料報表之前,需要先來熟悉下 Zeppelin 的 Notebook UI 界面布局。前面內建 Kylin 操作中已經提及到建立 Notebook 的操作,正如“建立 Notebook”圖中所示,通過 Notebook 下拉菜單,可以有如下的操作:

  • Create new notebook
  • Filter
  • Folder/notebook

Zeppelin 的 Notebook 是由不同的段落(卡片)組合而成的,建立好一個新的 Notebook 後,預設也會建立一個新的卡片,執行查詢後在界面上可清晰看到如下圖所示的區域劃分:

本地快速體驗 Kylin「分析篇」

Notebook 區域劃分

  • 綠色:功能區域,包括執行、展開/收縮、顯示/隐藏、設定等操作
  • 紅色:代碼(SQL 語句)編輯區域
  • 黃色:可視化顯示類型區域,切換不同的顯示方式
  • 黑色:結果顯示設定區域,針對不同的顯示效果做相應的設定調整
  • 藍色:可視化結果顯示區域

注:Zeppelin 的卡片不支援直接拖拽排列布局,需要通過功能區來操作(或是快捷鍵按鈕),關于功能區域各按鈕作用說明可參考官方網站說明:https://zeppelin.apache.org/docs/0.8.0/quickstart/explore_ui.html#note-toolbar 。

在了解清楚 Zeppelin Notebook 的布局和使用後,可得知通過不同卡片的組合就能輕松實作定制化的資料報表,那麼隻需要根據自己的想法來建立不同類型的資料卡片,最終形成與自己想法一緻的資料儀表盤,通過 Zeppelin 的 Report 模式釋出後可直接通路,如下圖所示。

本地快速體驗 Kylin「分析篇」

資料儀表盤示例

擴充可視化插件

Zeppelin 自帶的可視化圖形并不是很豐富,隻有常見的 5 種類型,包括有表格、柱形圖、餅圖、面積圖、折線圖和散點圖。這些圖形常常不能滿足我們做定制化報表的需求,Zeppelin 提供了基于 Helium 架構來豐富可視化元件的方式,擴充操作也是相當的友善,在頁面右上角的下拉菜單中找到 Helium,點選跳轉到 Helium 可視化元件清單頁面。浏覽并找到所需要的可視化類型,點選右側的 Enable 按鈕并在彈出的視窗中點選 OK 按鈕,稍等一會便可完成新的可視化元件的擴充,如下圖所示:

本地快速體驗 Kylin「分析篇」

擴充可視化插件

注意,新開啟的可視化元件需要重新開機後才能生效,在 Zeppelin 安裝目錄下執行如下指令進行重新開機,然後重新打開 Notebook,在卡片的功能區上面便可檢視到新可視化元件按鈕。

[[email protected] zeppelin-0.8.1-bin-netinst]$ bin/zeppelin-daemon.sh restart

總結

通過 Kylin+Zeppelin 內建來制作定制化資料報表,你能發現“麒麟”神獸除具有神速以外,還有強大的可擴充性能與 BI 工具友好的對接。除了本文中介紹到的 Zeppelin 之外,Kylin 還能對接很多 BI 工具,比如:Superset、CBorad、Tableau、Power BI、 帆軟 BI 、永洪 BI 等等。甚至,你還可以根據自身的需求,定制開發個性化的資料報表平台。用一句時髦的話來說,就是“沒有做不到的,隻有你想不到的”。

了解更多大資料資訊,點選進入Kyligence官網

繼續閱讀