資料化營運的定義與剖析
目前并未有人對資料化營運給出一個明确的定義:遇到這樣的情況,我一般會做說文解字的工作,即弄清楚什麼是營運、什麼是資料化,然後兩者是如何結合起來的。
講到營運,必然講到營銷,現代營銷理論最早可以追溯到羅姆·麥卡錫的《基礎營銷》談到的4P(product\price\place\promotion)理論,從4P的順序和定義可以看出,該理論核心是産品,但随着商業社會的發展,競争日趨激烈,商品數量及品類逐漸豐富,商業的重心逐漸由産品轉移到了消費者,是以應運而生4C(consumer\cost\convenience\communication)理論,具體來講,即
1、customer’s needsand wants;
2、cost and value tosatisfy consumer’s needs and wands;
3、convenience tobuy;
4、communicationwith consumer;
進入二十一世紀後,随着計算機行業的發展,科技的進步,大資料時代的來臨,市場營銷面臨越來越苛刻的營銷預算、海量的營運資料堆積和存儲,4C理論在商業部分發達國家已經不再适用,于是nPnC的理論随之出現。在此,以3P3C為例說明:
1、Probability:營銷、營運以機率為核心,追求精細化、精準率;——這兒的機率有兩層意思,從宏觀上來講,可以定義為特定消費群體整體的機率,從微觀上講,可以定義為具體某個消費者的響應機率;前者如目标市場定位、尋找相似特征的潛在使用者,後者如關聯算法、預測響應模型等
2、Product:注重産品功能,強調産品賣點
3、Prospects:目标使用者定位(市場細分)
4、Creative:創意——包括産品、文案、活動、合作等(營銷大師科特勒非常重視現代化營銷上的創新,為此著有《水準營銷》一書,下次可與讀者一起分享)
5、Channel:管道定位與投資回報核算
6、Cost/price:成本/價格
在這其中,資料分析挖掘所支撐的目标響應機率是核心,以此基礎上圍繞産品功能優化(産品A\B測試)、目标使用者細分(使用者聚類)、活動(文案)創意(活動成效對比)、管道優化(管道收益對比)、成本調整(投入産出比)等環節,共同促成資料化營運的完善,這兒需要重點說明的是,雖然在新的營銷理論中,資料分析挖掘涉及到營銷各個環節的決策與分析,但這并不是說市場營銷以資料分析部門為重,企業的核心、企業的利潤來源仍然是營運及市場部門,資料分析部門所提供的是分析的工具,是對企業營銷的武裝,企業将産品推向使用者仍需要能夠解決使用者痛點的産品、精準化市場定位、合适的管道合作、創意化營銷方案等這些基本元素,是以在大資料浪潮中,企業或非盈利部門應正确看待資料的作用和地位,合理地利用資料,切不可妖魔化或小觑之。
講到這裡,我們能夠自己給大資料營運下個定義,即:以企業(機構)海量資料的存儲和分析挖掘應用為核心支援的、企業全員參與的,以精準、細分和精細化為特點的營運制度和戰略;或者說是企業(機構)正常營運的基礎上增添資料分析和資料挖掘的精準支援。
資料營運并非一蹴而就:
首先,需要企業全員參與的意識:隻有所有部門員工達成這種意識,自覺運用簡單或複雜的資料分析工具,才能真正實作助力企業從資料中發掘資訊财富。隻有這樣,産品開發提出的新概念來源于使用者回報資料而不是拍腦袋出來的;營運人員才會提升營運前準備、營運中把握、營運後回報、修正,提升預見能力和掌控能力而不是被動地抄KPI報表;客服不再滿足于為客戶提供服務,而是有意識地挖掘有價值的客戶新需求;企業資料挖掘團隊也不再是孤軍奮戰于技術及項目工作,而是肩負企業全員的資料意識、資料運用技巧的推廣責任。如此,資料部門才能夠将其精神、血脈融于企業之中,帶動其它各部門的脈動,發揮出資料資産真正的價值。
其次,資料化營運應形成一種常态化的制度或流程:企業日常工作中所使用的資料結構和層次能夠判斷出該企業在資料應用上的水準和效率;
最後,資料化營運需要高層的倡導與推動:海量資料開發和應用是跨多部門、多技術、多專業的整合性流程,這些挑戰并非企業單個部門所能夠承擔。當今網際網路的巨頭在資料化道路上無不是如此,如在12年阿裡就設立了CDO(chiefdata officer),實行“資料分享平台”的戰略。
為何資料化營運:
1、企業競争白熱化的時代,傳統的營運方法很難提升企業的營運效率;
2、資料挖掘、資料存儲技術的飛速發展;
3、網際網路企業與生俱來的特點就是大資料,而随着網際網路+程序的加快,網際網路、物聯網、雲計算技術的打通,大資料已經不再是網際網路企業的專屬。資料已成為企業的最大财富,在16年的雲栖大會上,馬雲創造性地提出了五新,其中一新便是新資産(即大資料資産)。未來商業的競争優勢來源于對資料的解讀和快速反應能力。
實行資料化營運的前提:
1、能夠實作企業級海量資料的存儲:随着分布式技術成熟及網絡伺服器的發展,解決了資料倉庫、計算能力的一大難題,但企業實行資料化營運仍需要投入巨額成本在資料存儲倉庫搭建、維護及人力成本上;
2、擁有精細化營運的需求:如壟斷企業或極細分的區域性小企業,對精細化、個性化營運需求并不強烈,沒有必要實行資料化營運;
3、資料分析和資料挖掘技術的有效應用:一者企業需要一支能夠勝任資料分析和挖掘技術的工作團隊,包括擁有數理統計、資料倉庫、資料挖掘、業務學習及快速學習能力;二者資料分析團隊與業務團隊能夠互相協同配合,分析團隊不僅能夠得到業務團隊的參與與支援且業務團隊擁有相應的資料化營運的能力和水準。
4、決策層的倡導與支援
目前資料化營運的新發展——資料領域的新業态:
1、資料産品作為商業智能的一個單獨的發展和應用方向;即使用者在某些特定領域或特定資料時可以獨立分析和展示結果,而不需要分析師幫助的資料工具,如淘寶的“量子恒道”、百度的“百度分析”;
2、資料PD(product designer)成為資料分析和商業智能的一個細分職業;
3、泛BI概念的深入人心:即逐漸淡化資料分析師團隊作為企業資料分析的唯一專業隊伍形象,讓更多的業務部門員工也逐漸掌握資料分析的技能和意識;資料分析師承擔向業務部門指導、傳授資料分析和探索的能力培養工作;
什麼是資料挖掘
即從資料集合中抽取隐藏在資料中的那些有用資訊的過程,我稱其為有效化和顯性化;它包括資料庫、人工智能、機器學習、統計學、高性能計算、模式識别、神經網絡、資料可視化、資訊檢索、空間資料分析等多領域的知識和技術。
資料分析和資料挖掘的差別:
1、資料挖掘擅于處理大資料,是直接從大型資料庫中抓取資料并分析;
2、一般借助于資料挖掘工具,而并不需要特别的專業統計背景;
3、統計分析的前提是機率假設,但對于海量資料的資料挖掘來說,并不需要這些假設;
4、統計分析往往會出現一個或一組函數結果,但資料挖掘側重于應用,很多時候并不需要明确的函數關系,甚至不知道哪些變量在起作用;
實際應用中,分析與挖掘無分高下,應結合具體業務情況和業務需求來采用合适的技術。
資料挖掘主流技術——不詳細說,之後再與讀者展開分享:
1、決策樹:顧名思義,該技術規則是從根部開始,逐漸細分到各枝幹,每個枝幹即為一個規則,主要算法為CHAID(chi-square automatic interaction detector)—因變量為類别型變量|檢驗方法為卡方檢驗、CART(classificationand regression tree)--檢驗方法為基尼系數等不純度名額、ID3\C4.5\C5.0(iterative dichotomiser)--檢驗方法為資訊增益。
2、神經網絡:用計算機模拟人腦思維,簡單來講,該技術是通過輸入多非線性模型及不同模型間的權重互聯,最終等到一個輸出模型,主要算法為回報傳播(backpropagation)、多層前向型(multilayerfeed-forward)。多用于信号處理、模式識别、專家系統、預測系統。
3、回歸:包括線性回歸、非線性回歸和邏輯回歸(logistic regression);
4、關聯規則:主要目的是找出資料集中的頻繁模式,即cooccurrence relationships;如購物籃分析;主要算法為Apriori算法;
5、聚類:顧名思義,不做解釋,主要算法包括劃分法(K-means)和層次法,主要用于資料處理階段的探索和營運階段的群體劃分;
6、貝葉斯分類:羅胖雖是個文科生,但他對貝葉斯的了解還是非常到位的,該技術理念與人腦對事物判定的方法相似,典型案例就是“三人成虎”,即随着資訊的增多,結論就逐漸明朗,當然如果資訊是有偏的,結果也不一定準,就如這個例子一樣。
7、支援向量機(SVM):使用超平面分類的方法,這兒不展開讨論,它對于複雜的非線性決策邊界的模組化能力高且不易過似合,但需要的訓練資料量較大。
8、主成分分析:該技術屬于傳統統計分析範疇,主要原理為将多個原始變量合并成若幹主成分,再用于模組化分析,進而降低了資料的次元。它的推廣延伸即為因子分析。該技術在資料處理、降維、變量關系的探索方面;
9、假設檢驗:即小機率事件原理,即觀測小機率事件在假設成立的情況下是否成立;
網際網路行業資料挖掘特點:
1、資料海量性ß網際網路面向海量使用者及由此産生的海量網絡日志
2、資料分析(挖掘)周期短ß技術進步、白熱化的競争
3、資料分析(挖掘)成果時效性短ß使用者行為變化迅速
請聽下回分解:資料化營運主要應用項目類型&資料團隊與其它部門的分工協作
#######################################################################
歡迎微信交流:左碼為作者微信,右碼為作者公衆号(部落格文章會同步于公衆号釋出)
