天天看點

大資料如何起步?從小資料到大資料

要做大資料,首先要了解自己的企業,或者自己所在的行業的核心是什麼。我們現在經常發現,有很多企業在競争的過程中,最終不是被現在的競争對手打敗,而是被很多不是你的競争對手所打敗。很簡單的一個例子,大家都認為亞馬遜是做電商的,但這是錯的,它現在最主要的收入來自于雲(雲服務)。也就是說企業需要找到自己的核心資料(價值)。

目前國内外關于大資料的談論很多,大多是談營運級别的,或者說從服務端、服務方提得較多一些。筆者要跟大家交流的問題是作為各類企業尤其是客戶方的企業來說,大資料跟他們有什麼關系,或者說作為企業方怎樣去參與,這是企業方現在面臨的最大問題。

這個問題的答案重點在于大資料應該從小資料開始。因為現在很多企業面臨的最大問題不是怎麼用大資料,而是内部的一些小資料整合出現問題,或者小資料都沒用好的情況下怎麼用大資料。大資料應該是從小資料逐漸演變上去的,是一個正常的生态,而不是瞬間變化的。大資料這個概念跟自媒體的概念類似,需要企業自己去建設,而不是從一開始就想着依靠别人。很多企業在談自媒體的時候,像談别人的事情一樣。比如一談自媒體,就覺得那是第三方提供的一個平台,大家在那兒發發牢騷。自媒體是自己的媒體,企業自己也要參與進去。同樣大資料不是别人的大資料,我們假設有一個第三方提供了大量的資料,有很多很多資訊,CI、BI之類的很多子產品化東西供我們來用。如果這樣的話,你有,競争對手也有,你能得到的東西,競争對手也能得到的情況下,就不能稱之為核心競争力。大資料作為企業來說要變成自身的一個競争力,企業必須得建立自己的企業級的資料。

要做大資料,首先要了解自己的企業,或者自己所在的行業的核心是什麼。我們現在經常發現,有很多企業在競争的過程中,最終不是被現在的競争對手打敗,而是被很多不是你的競争對手所打敗。很簡單的一個例子,大家都認為亞馬遜是做電商的,但這是錯的,它現在最主要的收入來自于雲(雲服務)。也就是說企業需要找到自己的核心資料(價值),這個是最關鍵的。隻有在這個基礎上,建立自己的大資料才有可能,才能做一些延伸。其次,要找到内部的一些外圍相關資料,去慢慢地成長它。有點像滾雪球,第一層是核心,第二層是外圍相關的資料。第三層是什麼?就是外部機構的一些結構化資料。第四層是社會化的,以及各種現在所謂的非結構化的資料。這幾層要一層一層地找到它,而且要找到與自己相關的有價值的東西。這樣你的大資料才能建立起來。

第一步,找到核心資料。核心資料現在對很多企業來說實際上就是CRM,自己的使用者系統,這是最重要的。第二步,外圍資料。比如企業經常會線上上線下舉辦一些活動,在做活動的時候,消費者的資訊隻是簡單地提供在表單裡面,還是進入了CRM的系統裡? 第三步,正常管道的資料。舉例來說一個銷售快銷品的企業,能不能夠得到沃爾瑪的資料,家樂福的資料?很多國外大資料的案例,說消費者買啤酒的時候也會購買刮胡刀之類,或者一個母嬰産品的消費者她今天在買這個産品,預示着她後面必然會買另一個産品。這就有一個前期的挖掘。這些價值怎麼來的,這就需要企業去找正常管道裡面的資料,跟自己的CRM結合起來,才能為自己下一步做市場營銷、做推廣、産品創新等建立基礎。第四步,外部的社會化的或者非結構化的資料,即現在所謂的社會化媒體資料。這方面資訊的主要特征是非結構化,而且非常龐大。這對企業來說最大的價值是什麼?當你的使用者在社會化媒體上發言的時候,你有沒有跟他建立聯系?這裡有個概念叫做DC(digital connection)。所謂的網際網路實際就是一種DC,但是通常網際網路上的那種DC是在娛樂層面。用到商業裡面的話,就是企業必須得跟消費者建立這種DC關系,它的價值才能發揮出來。否則,你的資料以及很多的CRM資料都是死的。就像國外CRM之父Paul Greenberg寫的四本CRM相關書籍,前面三本都是在講資料庫、系統之類的。第四本書的時候,就沒有再講那些東西,講什麼?講互動,講DC,講怎麼跟消費者建立關系。

大資料如何起步?從小資料到大資料

  小資料向大資料邁進

有了這個資料庫去進行資料挖掘,或者在建立資料的過程中,企業需要從什麼方向去探索,也不是漫無目的的。首先應該跟着你的業務,業務現在有哪些問題,或者說這個行業裡面主要的競争點在哪裡,這是很關鍵的。有了這個業務關系以後,再形成假設,也就是說未來的競争點可能在哪裡,大到未來的戰略競争,小到哪些方面。然後下一步要怎麼做,這些形成一個假設,其次做一些小樣本的測試。很多企業一看大資料就很恐怖,說我也買不起那些大資料,也雇不起那麼專業的團隊,怎麼辦?自己做一些小樣本的測試,甚至通過電子表格Excel都可以做資料挖掘。不一定非要那麼龐大、那麼貴的資料。然後再做大樣本的驗證,驗證出來的結果就可以應用到現實中去。

在大資料尤其是網際網路時代還有一個最重要的點,就是失效預警。即你發現一個規律,在現實中應用了,但是你一定要設立一些預警名額。就是當名額達到什麼程度的時候,之前發現的規律失效,那你就必須發現新的、相關的,否則也會造成一種浪費。筆者看到一篇文章,其中有一個重要結論。大家都在說大資料的價值很有用的時候,很多企業說我積累了多少TB,多少PB,但是你基于老的資料得出的很多結論實際是在浪費你的資源。你挖掘出來很多資料、很多規律,如果錯了,明天按這個去做,就是浪費。是以需要有一個失效預警。在這樣的過程中,最終你需要對應建立起内部團隊,他們對資料的敏感度也才能培養起來。這時候你再去買大資料服務的時候才是有價值的。

所有這些工作作為企業來說是需要内部去做的,最終才能開花結果,有一些收獲。企業大資料起步,要從小資料開始。

注1:關于資料挖掘過程中是直接上來就大資料、全資料,還是可以從一些小資料、小樣本入手,這方面目前存在一些争論。本文為複旦大學主辦的“大資料與營銷傳播”高峰論壇的演講稿整理,僅代表作者觀點,供參考。

本文轉自d1net(轉載)

繼續閱讀