阿裡巴巴的數字化價值
資料中台的概念是阿裡提出來的, 是以講述資料中台的價值的時候,不可避免要把資料中台對于阿裡的價值說清楚。我認為阿裡巴巴首次把自己數字化能力展示出來的實踐視窗是2015的雙11大屏,而以前主要形式是年度的行業報告。大屏對于當時整個業務實時展現,把背後牽扯的資料處理能力展示的淋漓盡緻。
阿裡的核心電商業務,本身是完全數字化的。從進入淘寶的首頁到搜關鍵字,找到具體的寶貝,加購,支付,後面的物流,所有的一切,全部是通過自己的資訊化系統來完成了一整個的業務閉環,是以它本身是一個完全數字化的東西。
在這個過程當中,沉澱了大量的使用者行為資料、商品交易資料、物流資料還有售後資料,基于這些資料,整個阿裡内部的資料團隊做了大量的針對于自己業務的數字賦能提升。
這些資料最大的價值,主要展現在三方面:首先是廣告,即精準營銷。阿裡巴巴的千億美元的市值,很多是建立在廣告的基礎上;另外一個是推薦,阿裡GMV超過15%是由推薦系統直接帶來的;最後是整個電商内部的交易安全。可以看到在阿裡内部的整個數字化的場景,其實是跟網際網路行業高度吻合的。因為網際網路行業裡面大資料的應用場景其實主要就是展現在廣告,推薦和風控。這三大闆塊對阿裡的商業帝國起到了至關重要的作用,除此之外,在内部則主要展現在精細化的數字化營運。
這裡引發出一個思考:廣告、推薦和風控的價值是資料中台的價值還是算法的價值?算法是否可以脫離中台直接産生價值? 中台的價值針對于這三個算法場景提供什麼樣的價值?
最初,淘系、天貓、聚劃算都有自己獨立的推薦團隊,但現在是統一的團隊。當初每一個團隊基本上都是使用自己的基礎資料,因為在公共層項目前使用者資料、商品資料都不是打通的。
2013-2014年,阿裡啟動了資料公共層項目,這個項目的出發點是節省資源和統一基礎資料。因為當時整個阿裡雲包括算法團隊等各個團隊,所用到的分析的叢集已經遠遠超過了5000台,按照當時的規模,如果不做資料公共層這個項目的話,每年都要在新購資源上面花費1億多。啟動這個項目之後,讓算法工程師的工作起點從資料源搬移到公共層之上,不用去處理龐大的基礎資料資訊的工作,以便快速傳遞算法場景。
接下來大家沒想到的是,資料公共層這個項目越做越有價值。它不僅達到了最初的目的,還把整個公司集團的使用者資料和商品資料做了一個統一的管理。
是以對于企業來講,做數字化轉型是首先思考的是應用場景,由此來思考針對場景是否需要一個統一的資料中台。砍樹優先還是磨刀優先,這應該是每一個企業的決策人需要思考的問題,應該有自己的一套認知。
傳統企業數字化的必要性和重要性
現在的傳統企業數字化轉型越來越迫切了,我個人覺得主要是因為網際網路企業帶來的壓力,因為網際網路企業是直接面向終端客戶營運的。
1、網際網路企業本身是數字化營運的,是以它具有更靈活的業務轉型能力和業務調整能力。
2、借助自己的流量的優勢,不斷對傳統企業進行降維打擊,它的業務邊界延伸越來越長。如果說傳統企業完全不做一條類似于網際網路企業的數字化的生意的話,必然面臨來自網際網路企業的競争.比如各種C to XX。
3、傳統公司業務無法線上, 但是業務數字可以線上, 通過數字化營運進行反攻。通過資料技術和算法去切入業務流,形成一個智能化的閉環,然後讓企業的生産經營全過程都可度量和可預測。
把概念清晰化,從企業決策人角度來講,做數字化轉型之前應該問自己三個問題:
1.你是否清楚了解企業過去的經營情況和目前的業務情況?
2.是否對企業目前的經營情況,組織情況,都了然于心?
3.對未來所作的決策,不論轉型也好,場景優化也好,是否有數可依?
是以企業數字化轉型一個很大的意義在于,不再依賴于下屬彙報的各種各樣的資料,而是通過數字化的系統來擷取這部分資料。傳統企業現在的資料可能大部分來源于企業資訊化過程當中所産生可公開的資料,如傳感器、操作裝置。傳統企業在資料方面的最大弊端,在于沒有觸達最終用戶端,缺少了全量使用者的聲音,往往隻能參考一個取樣的聲音。這也是說網際網路公司拿到使用者的聲音去降維打擊傳統企業的一個原因。
實時資料更有價值
我們跳出來看看傳統企業會有哪些資料。資料可以總結為以下4份:使用者日志的資料,各種統計的資料,業務系統的資料,還有整個業務過程的資料。盤點下來之後,再從時間次元分為不同的量級。比如毫秒、秒級産生的資料、分鐘級資料,年度報表則是年度級的資料。從時間軸的角度來講,不同時效性的資料會有不同的價值。對于不同的企業來講,可能不同時效性的資料價值的重要程度就不一樣。對5G,loT這種較為巨大的行業場景來說,會更關注時效性低的一些資料,可以對于未來企業的戰略方向做一些準備。對于目前很多傳統的經營企業來講,可能更關注天級、月級的資料,因為那是代表企業業務過程的。并且由于業務部門資訊化資料的不完整,很多較大企業依然靠人為上報資料,這種情況下,資料則集中在天級左右。
對于不同的使用者來講,對于資料在不同的次元上的關注也是不同的。比如說時效性大概在秒級的資料,可能是系統運維的人員比較關注的,因為要保障整個系統的使用,不能當機。那對于開發來講,主要是要做到問題診斷,有可能就是在運維的資料之上。有一部分營運,比如說阿裡小二,更注重實時,因為包含運維營運的各種安全性。對于業務數字的營運,則可能在天級以上。前面提到阿裡的三個最大的場景,基本上都應用的是實時資料。這也是目前所認為的趨勢,實時資料的價值往往比離線資料價值大。
通用算法方面,實時資料的時序預測方法是可以直接運用在實際處理上的,根本不需要再做各種離線算法在場景下面的各種資料清理和特征構造。是以對于時序資料來講,可以直接把算法服務作用在時序資料上,比如aws開放的forecast服務。
其次,也更有助于我們關注場景通用模型。現在大部分企業都在建自己的終端客戶管道,建設了之後,免不了就會收集到大量的終端管道的使用者行為資料。它包含就是各種各樣的使用者行為,比如點選浏覽、跳轉,在展現使用者行為分析的基礎上,我們的這個産品内置各種各樣的公開的漏洞分析、留存分析、還有使用者畫像等産品。實時資料可以幫助我們玩轉模型。
資料中台在實際場景中的解決方案
以某醫療器械公司為例,由于業務線分支龐大,資料的彙報則标準不一,就給決策造成了難題。而用資料中台則可以完美地解決這個問題。

問題概況
解決方案
資料中台的項目以資料場景的咨詢為入口。從産品銷售分析的角度,業務預測和預警的角度,銷售過程管理的角度,客戶分析的角度,營運成本管理的角度,還有管道管理的角度做大量的規劃和設計。
在之前,隻能用銷售分析的系統處理報表資料,用客戶畫像系統處理客戶資料,是重複造輪子的一個怪圈。而阿裡已經幫我們探了路,可以用資料中台這個方案來解決問題,磨刀不誤砍柴工。就可以避免這個情況了。
另外,不管是對資料處理的邏輯的複雜程度,還是對于資料處理的技術上的要求,資料處理依然是很複雜的過程。是以一定需要資料中台的産品再加上方法論,來将原始資料轉換成可以直接給資料分析和資料挖掘人員去做實用的基礎。而資料中台本身就是一個工具性的産品和工具性的方法論。
傳統資料中台的實施路徑
指定完整的規劃,統一架構平台,統一标準規範,然後按照資料源做統一的資料采集,再做統一的數倉設計,形成統一的資料資産,最後再基于統一的資料資産做各種各樣的資料運用。
在實施過程中,基于資料應用的次元上做一個靈活資料中台開發,以資料應用為傳遞機關。在互動資料應用的過程中,慢慢形成整個企業的資料中台,是不小的挑戰。但收獲也會很大,包括對資料技術的深入了解,阿裡雲的資料産品的了解,還有對整個行業知識的了解。這些都賦予我們思索資料中台的價值的能力,以及抽象模型的能力。
駐雲實施資料中台的兩條路
最後,在了解了業務、産品、組織、系統後,知曉過去,理清現在,判斷未來。如此,才能做好适合的中台架構設計。