作者:張骞 更多内容詳見資料中台官網 https://dp.alibaba.com
前言
随着大資料趨勢的迅速增長,資料的重要性與日俱增,企業内看資料、用資料的訴求越來越強烈,其中最常見的就是各種經營報表資料:
老闆每日早晨9點準時需要看到企業核心的經營資料,以便進行企業戰略及方向決策
業務負責人不定期進行個性化的項目籌劃,需要多元、及時的效果資料以優化項目安排
小二精準營銷活動開展,需要和高層一緻但粒度不同的經營分析資料,并進行活動政策調整
……
舉個經營報表的例子如下:

- 加工時間長、人工成本高,招再多的分析師也難以滿足需求;
- 代碼可讀性差,資料可維護性差,類似需求需要反複、重複開發;
- 代碼開發不規範,加工過程中難以避免的計算存儲浪費;
- 得到的資料名額,複用性差導緻重複建設,資料越來越不标準規範;
- 這種情況下對業務的直接影響就是:決策周期長(資料需求滿足慢),決策易出錯(資料名額口徑不一緻)
Dataphin:讓“名額電腦”代替“代碼編輯器”
既要保證資料生産時效性——及時産出資料并滿足需求,又要支援資料多樣性——企業自下而上不同業務分析場景,最後還要保證資料準确性——任何時間、不同崗位的人都能用同樣的資料解讀經營情況,怎麼才能做到呢?
企業的發展加速,離不開20世紀的文檔管理轉到21世紀的資訊管理。同樣的,如果繁複的名額代碼編寫工作,也可以如電腦一般,界面可視化點選,複雜的代碼研發過程由電腦自行處理完成,就好了。
而Dataphin基于One Data - One Model能力,就可以充分實作這個能力!
Step 1 選擇組合條件
如下圖,确定需要統計計算的值,Dataphin裡稱為“原子名額”——最小的資料值統計單元,比如使用者數這樣的統計值等,然後組合如下内容:
A. 統計計算值需要應用的分析對象,Dataphin裡稱為“統計粒度”——次元或次元的組合,比如使用者星級、使用者狀态等;
B. 資料統計計算的時間周期,Dataphin裡稱為“統計周期”——統計資料需要跨越的時間長度,比如最近1天、最近30天、自然周、自然月的等;
C. 資料統計的其他個性化限定條件,Dataphin裡稱為“業務限定”——資料記錄的篩選過濾條件,比如生鮮業務類型、PC端、女性等。
Step 2 預覽名額
選擇完畢組合條件後,可以預覽組合出來的派生名額:
1)組合的名額,預設名取“原子名額+時間周期+業務限定”組合名,保證命名标準規範。
2)曆史已生成的組合,不再生成,保證名額建設統一,無重複
Step 3 一鍵自動化生成!
确認需要送出的名額後,一鍵【送出】,分鐘級名額生成:
1)自動彙聚至以“統計粒度為主題”的彙總邏輯表表下,保證管理标準規範;
2)代碼和排程依賴關系,系統自動生成;
3)派生名額基于彙總邏輯表,可快速雪花模型查詢使用名額、分析對象的屬性資訊。
①派生名額自動彙聚至彙總邏輯表
②派生名額所在彙總表節點,代碼及排程關系自動生成
③彙總表及派生名額可查詢消費
Step 4 複雜需求實作
上面主要是基于簡單統計名額實作,實際上,報表需求還有類似 比率型、乘積型等複合統計方式,比如“客單價=銷售額/客戶數”,這類也可以通過Dataphin的衍生原子名額實作:
1)衍生原子名額是基于原子名額的再組合;
2)基于衍生原子名額建立派生名額時,需要保證拆解到最細粒度的原子名額,有相同的分析次元、時間周期,允許次元的計算路徑不同、設定的業務限定不同。
①建立衍生原子名額
②基于衍生原子名額建立派生名額
Dataphin:“名額電腦”背後的故事
上面步驟可以看到,派生名額的計算生成,離不開原子名額、業務限定、統計粒度的協助,這其中有什麼奧秘呢?
其實很簡單,用Dataphin高效建立派生名額,掌握這1張圖就夠了:
1)原子名額為核心,原子名額的來源表為中心
2)統計粒度取自來源表的關聯次元,以及關聯次元上的關聯次元
3)業務限定基于來源表為中心的雪花模型做定義
4)統計周期可任意搭配使用
總結:One Model,One Dream
Dataphin作為阿裡巴巴資料中台原創産品,從設計之初就決心為業務價值而生!
其中的智能研發版以One Data - One Model的方法論為指導,緻力于統一的資料建構與管理:
名額【标準化】,保證資料研發的【一緻性與效率】
【拖拽式】資料模型設計+【自動化代碼】開發=高效的【資料研發生産力】
進而幫助企業充分發揮資料價值、實作業務價值:
100%消除二義性:根據【選擇條件】組合,【批量生成】統計名額
分鐘級自動化代碼生成:【可視化設計】編輯邏輯表星型模型/雪花模型,【設計送出】自動化生成代碼(設計即開發)
希望不遠的未來,每個企業都可以基于Dataphin做出最高效、最全面、最正确的決定!
結語:
阿裡巴巴資料中台團隊,緻力于輸出阿裡雲資料智能的最佳實踐,助力每個企業建設自己的資料中台,進而共同實作新時代下的智能商業!
阿裡巴巴資料中台解決方案,核心産品:
Dataphin,以阿裡巴巴大資料核心方法論OneData為核心驅動,提供一站式資料建構與管理能力;
Quick BI,集阿裡巴巴資料分析經驗沉澱,提供一站式資料分析與展現能力;
Quick Audience,集阿裡巴巴消費者洞察及營銷經驗,提供一站式人群圈選、洞察及營銷投放能力,連接配接阿裡巴巴商業,實作使用者增長。
歡迎志同道合者一起成長!
更多内容詳見資料中台官網