天天看點

DataWorks資料分析維表,資料分析師的手中利器!

資料分析

是由 Dataworks 團隊推出的一款智能資料快速洞察及可視化報表搭建平台,是Dataworks開發平台的重要組成部分。它走完了使用者一站式開發的最後一公裡路,從資料內建 -> 資料開發 -> 資料服務 -> 資料分析,使得資料開發者和資料分析者的身份邊界逐漸被打破,使用者既是資料開發者,又是分析者。

維表

支援使用者使用圖形化的方式建立MaxCompute生産表、編輯MaxCompute表資料、多人協作修改、表格導出等功能。一鍵同步你的MaxCompute生産表。

為什麼要有維表

想象這樣一個場景:資料分析師、營運同學需要手工維護一張線上MaxCompute表。

沒有維表時,營運同學找到BI描述需求,BI提給研發同學,研發使用Dataworks編輯Sql語句建立Excel、塞入資料傳遞給營運。每當資料有變化時,就要重新來一遍該流程。在各個部門業務壓力如此大的alibaba,無論是營運、BI還是研發同學都叫苦不疊。

現在有了維表,營運同學隻需要自己到資料分析維表工具中建立一張維表,像操作本地Excel一樣将要修改的資料儲存到Sheet中,便會自動同步資料到MaxCompute的生産表,使大家的工作效率飛速提升~

自從彈内釋出以來,維表功能就廣受好評。越來越多的資料分析師已經使用維表進行資料維護了。

現在維表在彈外重磅釋出,你還在等什麼呢,快來試用吧~~~

我們實作了什麼

  • 同時支援圖形化、DDL方式配置維表,除了使用圖形化直接建立維表,喜歡敲代碼的同學可以導入DDL建表語句快速生成維表~
  • 資料一鍵同步MaxCompute生産環境,在維表Excel中完成資料編輯後儲存即可同步MaxCompute線上表。
  • 支援導入本地表,同時可以支援使用者自定義列映射、分隔符、線上設定編碼、追加/覆寫的導入方式。靈活操作導入方案的同時和亂碼說拜拜~
  • 支援表格導出,在D2使用腳本查詢維表内容後,通過WebExcel做資料分析後導入到玄機藏,安全審批後下載下傳到本地。安全又快捷~~~
  • 維表開放分享編輯功能,維護維表的過程不再孤單,小夥伴們可以組團進行維表編輯。

下面重點介紹維表使用文檔:

圖形化/DDL模式建立MaxCompute線上表

圖形化生成:

DataWorks資料分析維表,資料分析師的手中利器!

DDL模式建立:

DataWorks資料分析維表,資料分析師的手中利器!

其中

  • 目标工作空間:維表對應的MaxCompute資源所屬的DataWorks工作空間
  • 表名:MaxCompute表名,資料分析的維表名與MaxCompute始終保持一緻,故僅需确認MaxCompute表名即可
  • 表描述:對表的用途、性質等一些補充說明
  • 字段:添加MaxCompute的字段,為簡化處理,字段類型僅支援String
  • 生命周期:表的存儲會占用MaxCompute資源,故建議對表設定合理的生命周期,以便資源回收
  • 風險知曉:資料分析的MaxCompute表維護在生産環境中,故表的建立者應當對表的建立和後續維護負責
  • 導入DDL:使用DDL語句導入表資訊

維表是直接建立在MaxCompute中的表,資料分析子產品中僅同步資料結構,不儲存資料;故需要注意兩點:

  1. 需要開通MaxCompute
  2. 目前使用者需要屬于某一個DataWorks工作空間,并且需要相應分析師的權限,通過工作空間使用MaxCompute的資源
  3. 建立出來的維表屬于對應項目空間生産環境,是以第一次使用仍然需要申請字段權限,彈内通過安全衛士,彈外通過資料地圖

另,為簡化使用,維表的字段類型全部處理為String類型,如需使用其他字段類型,資料分析提供的功能暫不能滿足,建議通過DataStudio執行DDL語句來建立維護表。

支援導入本地表

DataWorks資料分析維表,資料分析師的手中利器!
  • 原始字元集:上傳csv檔案本身的字元集,支援GBK、UTF-8兩種格式字元集切換
  • 分隔符:通常用來自定義指定換行分隔符
  • 資料預覽:上傳csv檔案内容預覽
  • 字段映射:自定義配置字段映射
  • 資料追加方式:選擇追加/覆寫方式追加資料

維表支援資料導出

透過一個動圖檢視線上維表如何導出并下載下傳到本地的

DataWorks資料分析維表,資料分析師的手中利器!

維表分享編輯功能

  • 分享分為編輯、隻讀權限,所有成員共享維表Owner的權限,也就意味着一定要做好權限管理哦!