天天看點

從BAT看企業建構大資料體系的六層級

本文将企業大資料體系的建構分為六個層級,但并非是線性過程,每個層級之間或有基礎關系,但并不是說一定要逐層建構。例如創業型公司,在缺乏資料研發實力的時候,多數會借助第三方平台進行資料上報與分析。

下面一張圖,是本文的精華概括,後面一一展開與大家探讨。

從BAT看企業建構大資料體系的六層級

一、資料基礎平台

基礎的資料平台建設工作,包含資料平台建設,資料規範,資料倉庫、産品資料規範,産品id,使用者id,統一sdk等。

很多公司的資料無法有效利用,就是缺乏統一規範,産品資料上報任由開發按照自己的了解和習慣上報,沒有标準化的sdk和上報協定,并且資料散落在各個部門産品的伺服器,無法建構結構化的資料倉庫。

做資料平台的架構,很多人會了解為高大上的技術活,其實整個資料平台價值的展現,需要公司各個部門的配合,例如關鍵資料名額體系的建立,需要從各個部門業務名額進行提煉,并得到業務部門認可。常見的關鍵名額有:dau、pcu、wau、mau、按天留存率(1-30日留存)、累計留存率(7日、14日、30日累計留存率),新增使用者,有效新增使用者,活躍轉化率,付費轉化率,收入名額,arpu個人所得,管道效果資料等。

下圖是騰訊和阿裡的資料平台架構。

從BAT看企業建構大資料體系的六層級

阿裡大資料業務架構:

從BAT看企業建構大資料體系的六層級

阿裡雲梯分布式計算平台整體架構:

從BAT看企業建構大資料體系的六層級

二、資料報表與可視化

在第一層級中,進行資料名額體系規範,統一定義,統一次元區分,就可以很友善的進行标準化可配置資料報表設計,直覺的可視化輸出設計,包括行為、收入、性能、品質等多種資料類别。

在ppt中以友盟、迅雷、百度、騰訊等公司的資料報表體系進行詳細講解。

騰訊資料門戶

從BAT看企業建構大資料體系的六層級

阿裡資料地圖

從BAT看企業建構大資料體系的六層級

三、産品與營運分析

在建立資料平台和可視化基礎上,對已有的使用者行為、收入資料等進行各種分析,輸出日報、周報、月報、各種專題分析報告。常見的資料分析工作如下:

1. a/b test進行産品分析優化;

2. 運用漏鬥模型進行使用者觸達分析,如tips、廣告等曝光到活躍的轉化;

3. 收入效果監控與分析,包含付費轉化率、管道效果資料等;

4. 業務長期健康度分析,例如從使用者流動模型、産品生命周期分析産品成長性和健康度;

5. 營銷推廣活動的實時回報;

使用者畫像也是常見的資料分析方式,包括使用者如性别、年齡、行為、收入、興趣愛好、消費行為、上網行為、管道偏好、行為喜好、生活軌迹與位置等,反映使用者各種特征,以達到全面的了解使用者,針對性的為使用者提供個性化服務的目的,通常每半年做一次使用者畫像的專題分析。

下圖是常見的資料分析思路:

從BAT看企業建構大資料體系的六層級

常用分析工具:excle,spss,sas,enterprise miner,clementine,statistica。個人用的比較多的是:excel和spss。

下圖是spss常用的資料分析與挖掘方法:

從BAT看企業建構大資料體系的六層級

四、精細化營運平台

基于資料基礎上搭建的精細化營運平台,主要的平台邏輯多數是進行使用者細分,商品和服務細分,通過多種推薦算法的組合優化進行商品和服務的個性化推薦。另外還有針對不同産品生命周期,使用者生命周期建構的産品資料營運體系。

從BAT看企業建構大資料體系的六層級

五、資料産品

廣義的資料産品非常多,例如搜尋類,天氣預報類等等。這裡主要講狹義的資料産品,以bat三家公司的資料産品為例進行分享。

騰訊:廣點通、信鴿

阿裡:資料魔方、淘寶情報、淘寶指數、在雲端

百度:百度預測、百度統計、百度指數、百度司南、百度精算

截取幾張ppt如下:

從BAT看企業建構大資料體系的六層級
從BAT看企業建構大資料體系的六層級
從BAT看企業建構大資料體系的六層級
從BAT看企業建構大資料體系的六層級

六、戰略分析與決策

戰略分析與決策層,更多的是跟很多傳統的戰略分析、經營分析層面的方法論相似,最大的差異是資料來自于大資料。

有很多企業錯誤的把“業務營運監控層”和“使用者/客戶體驗優化層”做的事情放在經營分析或者戰略分析層來做。傅志華認為“業務營運監控層”和“使用者/客戶體驗優化層”更多的是通過機器、算法和資料産品來實作的,“戰略分析”、“經營分析”更多的是人來實作。很多企業把機器能做的事情交給了人來做,這樣導緻發現問題的效率較低。

建議是,能用機器做的事情盡量用機器來做好“業務營運監控層”和“使用者/客戶體驗優化層”,在此基礎上讓人來做人類更擅長的經驗分析和戰略判斷。

在變化極快的網際網路領域,在業務的戰略方向選擇上,資料很難預測業務的大發展方向,如果有人說微信這個大方向是通過資料挖掘和分析研究出來,估計産品經理們會笑了。從本質上來說,資料在精細化營銷和營運中能起到比較好的作用,但在産品策劃、廣告創意等創意性的事情上,起到的作用較小。但一旦産品創意出來,就可以通過灰階測試,資料驗證效果了。

原文釋出時間為:2014-07-01

本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号

繼續閱讀