大資料可以幫助商業營運者找到大緻方向,但真正落地到商業操作,反而不如小資料更有用、更有效。事實上,大資料的應用既不便宜,也存在一定的缺陷,更尚未充分提升商業的價值,更需要企業家、産品經理等管理精英們的創造性思維,使大資料能正确地産生商業效應。
現狀:盲目收集與淺應用
目前,大資料應用中有個怪現象,就是有什麼資料就收集什麼資料,至于将來有什麼用,一概不知。或者抱着“先收集再說,将來總有用”的态度。我建議,應從問題、願景導向來收集資料。一方面,資料的收集、存儲備份等成本都不低;另一方面,資料的價值也可能衰減。
以使用者為核心的kpi體系能實作與客戶行為的點對點連通,是未來發展的大趨勢。傳統的使用者價值是以利潤貢獻為核心衡量名額,而在大資料時代,客戶關系的管理不同了。例如,我要知道一個客戶一個月内到淘寶多少次,不管他是否購買,要看他與淘寶的關系到底怎麼樣。
就現狀而言,大資料技術更多地用于推薦和營銷,不是因為它更容易,而是因為它容錯的空間更大。比如,推薦系統給出了顧客不喜歡的推薦,大不了重新推薦;然而一旦上升到直接解決問題的層面,容錯空間就大大縮小了。例如,利用大資料技術來觀測空氣品質,錯了也不會有太大影響,但如果把這個指數和某個商業營運挂鈎,就不是小事了。尤其是對資料的精确性要求較高時,資料的持續跟蹤與多源比對就顯得非常重要。然而正是在這些方面,大資料的應用還停留在比較膚淺的層次,甚至壓根就飄在空中。
是以,公司要建立資料收集系統,更重要的是建立跟蹤資料品質的監控,對一些關鍵資料要尋找多個源頭,一方面確定“雞蛋不在一個籃子”,另一方面要互相比對、印證。對于實際營運的企業來說,資料必須有連貫性,當然真實性更是基本前提。
大資料還是小資料?
我幾乎每周都要拜會或面試很多資料科學家、資料分析師。我經常問他們,“在你心裡什麼是大資料”。回答顯示,原來業内的認知分歧絲毫不比外行少——至少有一半受訪者或應聘者對“大資料”這個概念根本就不以為然,而是更關注有價值的資料、資料能産生什麼價值。換言之,在部分人看來,“大資料”本身就是一個僞概念。我常問的第二個問題是,到目前為止,你做得最好的大資料案例是什麼?他們的回答各有不同,但有個共同點:用大資料來處理資料的稀缺性。比如,北京的空氣品質監測站是有限的,其資料對于監測站附近範圍的品質呈現是比較準确的,但其餘地區的品質資料是非常稀缺的,但我們要據此判斷出北京市空氣的整體品質。換言之,大資料能幫我們增加對未知部分的準确度、精确度的把握。
現在,有很多人讨論大資料與小資料的關系。其實,這個問題與大資料如何落地密切相關。在我看來,大資料可以幫助商業營運者找到大緻方向,但真正落地到商業操作,反而不如小資料更有用、更有效。比如,很多營運者宣稱自己的注冊使用者是多少量級的,但1億個注冊使用者的基礎資料,不如一千萬個活躍使用者完整的行為資料更具有價值。初創企業進行客戶探索、發現和驗證時,幾百個甚至幾十個顧客、使用者的完整資料比千萬級資料更有價值。也許正是因為資料量雖大,但每個資料單元都出現了斷裂或遺漏,導緻大資料的價值難以被挖掘出來。
是以,應用大資料的能力之一就是把資料變小的本領。在建構資料模型時,你需要的樣本其實不是千萬,甚至不是面面俱到的資料,而是比較敏感的資料名額。這對資料收集和分析人員是巨大的挑戰。實際上,大資料的應用和落地也要以資料的細分為基礎。例如,某電商顧客的真實性别不一定與購物的性别偏向一緻;再比如,關鍵詞搜尋量要看北京、南京等地各為多少,而不是籠統地說增長了多少。當我們用放大鏡細查大資料時,會發現有不少的“斷鍊”和欠完整。從某種意義上說,并沒有真正的“全面資料”,差别隻在于放大鏡的倍數。是以,即使基于大資料進行決策,也仍然有猜測和賭博的成分,大資料和小資料應該可以互為作用,而非比較兩者誰更強。
傳統企業怎麼辦?
我們在談論大資料的時候,在根本上忽略了一點,很多企業本身是有其架構的,不會因為大資料就立即變得不一樣。很多公司連資訊(information)都未打通,是堵塞、零散的,更不要說大資料的應用了。大資料作為一種新的營運理念和方法體系,要想嵌入到公司裡,必然要經曆一個新事物在舊公司的所有困難。
從有效的政策來說,先把既有的資料用好,比盲目推進大資料要明智得多。更進一步,要重新定義資料架構來解決存在的問題。比如,很多企業都開啟了公司微網誌,其測定效果是轉發多少、評論多少。但實際上要細分這些資料,進一步厘清誰、什麼樣的轉發和評論才是有價值的,還要和相似的公司微網誌進行對比。
傳統企業究竟是建立起獨立的收集系統,還是使用别人提供的資料?我認為要兼有,既要有側重地獨自搜集,也要多源化地擷取資料,盡力排除各種資料在搜集過程中形成的偏差,這既是一個技術問題,需要資料人員付出艱辛的努力,也是一個戰略問題,需要回到前文所述的小資料問題。
原文釋出時間為:2014-07-21
本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号