天天看點

深刻!阿裡、寶潔大資料實戰

深刻!阿裡、寶潔大資料實戰

虎嗅f&m;創新節的“如何洞察使用者:阿裡與寶潔的大資料實戰”專場裡,阿裡巴巴資料委員會會長車品覺、寶潔中國市場研究部總經理李霈、英特爾中國研究院首席工程師吳甘沙和股票雷達創始人馮月聊到一個很有趣的話題:作為傳統公司,寶潔很羨慕阿裡能夠輕易收集到真實、實時、全面的的資料,但車品覺卻說,大資料公司對資料處理同樣存在兩個難點:

第一大資料太大,大資料公司跟傳統公司一樣需要做“采樣”的工作。

第二是很難還原真實需求。“使用者研究上來講,大資料給予的力量就是還原使用者的真實需求。”但今天沒有一個還原是完整的。尤其是無線的出現,是增大了資料的斷裂。“場景在變,以前有一部pc鎖定了你的位置。今天移動來了,你們的場景變化非常大,你是從一個電影院出來,還是剛吃完飯出來,整個場景變化是非常大的,是以它所收集資料背後的原因跟場景非常不一樣,這也讓底層的資料變得不一樣。”

他還說到,網際網路大資料跟傳統公司收集的使用者資料的一大不同是,不是用資料來判斷事情的未來怎麼樣,而是後面能不能找到他的回路。“可能我第一次判斷是錯誤的,但是有足夠的資料告訴我是錯誤的。我們要非常快速的收集錯誤,把原來那個東西去做改正,同時想怎麼樣收集的更精确,如何收集他的更多的情景。”

對話實錄如下:

吳甘沙:大家好我是來自于英特爾的吳甘沙,一直在做大資料。大資料經曆了幾個階段:

第一個階段叫瞪眼階段,數目是讓人瞪大了眼睛。ibm說90%的資料是過去兩年産生的,idc說現在有多少折位元組的資料,英特爾有網際網路一分鐘産生了多少資料,谷歌說我們現在一天産生的資料超過從人類文明曙光開始到2013年産生的所有資料,是以這是第一“瞪眼時代”。

第二個是定性時代。第三個時代是理念時代。

第四的時代是“迷糊時代”。所有人都在說大資料,但是所有人都不知道大資料該怎麼做。今天我們很榮幸請來了兩個明白人,阿裡巴巴集團副總裁資料委員會會長車品覺先生,另一位是寶潔中國區市場研究部總經理李霈先生。我們希望兩位幫大資料做正本清源。

請兩位花幾分鐘時間講講你心目中的大資料和使用者洞察是什麼?

大資料的力量與難點:真實的還原

李霈:我是李霈,是寶潔公司市場研究部的,今天很高興參加這個活動。

對我來講,我們有很多傳統的研究消費者的方法也有很多新的方法,傳統方法更多的基于使用者的問卷和結構化的資料,而新的方法更多的是基于非結構或者大資料觀察消費者的行為的内容。

大資料時代确實給我們帶來了很棒的變化,我個人覺得有三點,真實性、實時性和全面性。

車品覺:使用者研究上來講,大資料給予的力量就是還原使用者的真實需求。還原一個真實的需求之後才知道怎麼利用這個資料做最終判斷。

這點說起來很容易,做出來很難,過去講資料化營運,就是用資料做出一個判斷,幫助企業解決一些問題。企業的問題可能是要研究使用者的未來的需求,是以要去用資料還原,還原過程中發現真正的資料不夠,是以會去找體外的資料,用這個資料得到一些新的結論,我認為這就是大資料的力量。

大資料的難點就是怎麼樣才叫“真實的還原”。因為沒有一個還原是完整的,盡量用今天有的一些資料、以及其他人的資料幫助我們達到這樣的一個資料儲備,最後才可以用資料。

吳甘沙:大資料應該是幫我們把消費者還原成一個人。不能單獨隔離他的某些行為,而是要看他的整個生活環境和生活背景。

車品覺:我最近常常舉一個例子,比如我在路上看到一個人穿一個t恤很好看,上班以後我在淘寶上搜,淘寶不知道我是路上看中的,是以背景的還原不是足夠的。

吳甘沙:您希望任何一個動作發生以後,您能夠還原他所處的語境,甚至這個動作以前一系列的聯系的語境。

車品覺:盡量。

有技術就能用全量資料?一樣要采樣

吳甘沙:大家知道寶潔是人類曆史上最早開始實踐商業智能的公司,到現在差不多30年的時間了。在現在這樣一個大資料和網際網路時代,商務智能被賦于了什麼樣的新的含義?

李霈:寶潔在過去幾年裡,從組織架構上有專門的團隊來做這方面的工作,大資料也都應用在日常的工作程序中。一方面我們會和很多第三方平台合作拿到大資料,另一方面也在打造我們自己的大資料。比如寶潔中國有一個生活家的俱樂部,現在為止有1500萬的會員,我們收集了他們的資訊,這對我們來說就能更好的服務他們。

我們不光是希望有一些短期的回報,比如通過資料做一些精準投放,我們還期待能利用這些資料做一個長期的觀察,長期增加使用者黏度和增加購買力,希望建立一種一對一的、很親密的戀人式的關系,更好的服務他們。

另一方面,怎麼樣用大資料了解消費。不光是大資料,包括網際網路技術,對我們來說都帶來了非常大的機遇,在洞察使用者的真實性、時時性和全面性上。

我本人負責嬰兒護理品類,我們擁有中國最大的紙尿褲品牌邦寶士,我們跟消費者接觸的時候,發現現在媽媽時間很少,傳統的方法很難跟她們交流。最近我們用微信跟她們交流,發現在那上面媽媽可以用碎片的時間跟我們交流,可以發圖檔,發視訊,而且她們在一起聊天很熱烈,幾天之内就是幾千條的資訊,幾百個圖檔和視訊。她們甚至會在半夜給孩子喂奶的時候突發感慨發大段的資訊給我們。這讓我覺得很激動,這是真正利用數字技術深入到她們的内心。

還有一個就是全面性。這是大資料對我們來說非常有幫助的地方。傳統的調研方法上,由于成本和操作性的限制,隻能選取一些代表性的人群和地點做代表性的抽樣,不夠全面。比如我想了解江蘇鹽城和廣東肇慶消費者選擇洗髮乳有什麼不同,傳統的方法很難做到。大資料就可以。去年我們和百度合作,通過分析消費者在不同城市搜尋的不同,來研究他們對産品的喜好,并且應用到我們的分銷和營銷的角色過程中,這能保證在那個城市的消費者能夠用到他們所喜愛的産品。

另外我們對産品的測試,以前也是隻能選取某一些消費者來傾聽回報,其他的消費者就不知道了。最近一年通過電商平台,我們夠做到對每一個産品都能收集很好的評價和回報,幫助我們對每一個産品的改進和創新。

吳甘沙:車總我知道您以前在傳統行業做,在銀行,電信,現在也是在最前沿的網際網路。剛才霈總說真實性、實時性、全面性,你肯定都能掌握。您覺得有沒有一些傳統的資料分析工具或者是理念、或者是方法論,是現在大資料的場景下可以借鑒的?

車品覺:阿裡大資料做了幾年。其實對大資料也是需要采樣的,不可能所有資料都用。我們是在努力把東西變得實時,但我們的倉庫裡很多資料還是t+1的,實時性今天也不是很多做大資料公司能完全做得到的。全面性就更難做得到了。是以采樣什麼時候都需要做,不是說傳統行業需要采樣,我們做這個行業大資料公司就不采樣了,還是會采樣,而且面對的問題也是一樣的。線上線下唯一的分别是,我們在資料足夠的情況下還是以觀察為主,不會輕易的問消費者,你準備得怎麼樣。

淘寶不管有多麼大量的資料,也不可能知道使用者不在淘寶的時候在哪裡。類似這樣的例子還是要用抽樣的方法給到我們答案的。

交易批量資料而非個體資料,保證安全

吳甘沙:車總講的非常有料,所謂的全量資料,第一有沒有全量資料?第二是不是處理得動?還是要經過采樣。第三資料精确性還是很重要。大家知道傳統的類似于淘寶這樣的,有一個零售商很厲害,沃爾瑪。他們有一套非常厲害的大資料系統,能夠時時的跟上下遊供應商分享資料。現在大資料時代,大家都哭着喊着說沒有資料,阿裡是資料大戶,現在都流行打土豪,我們沒資料,阿裡有資料,大家都說資料要分享,我想聽聽車總,現在阿裡關于資料分享這塊有什麼樣的動作和理念?

車品覺:分享的時候,即使是在我們公司内部分享,都要想資料分享過程中是否安全,安全作為資料開放的一個保障是很重要的。另外當我們講到資料開放的時候,就要包括責任。資料玩起來要對社會負責任,不能說因為玩起來了對資料不負責任。我們是資料的保管者,要做好報隐私的責任,我覺得将來越來越多的人會提到這個觀點的。

吳甘沙:共享和資料安全是是對立的,大家知道美國曆史上資訊自由法案出來之前,政府也是拿了很多安全的理由搪塞對資料共享開放的要求。據我所知阿裡也有資料安全委員會,會不會拿這樣一個擋闆防止資料共享?另外,剛才您講到了關于很多個人的資料,沃爾瑪那個是反應的更多門店聚合的資料變化趨勢,在這塊,我知道阿利耶有類似的産品,這塊有沒有更多的共享?

車品覺:應該會越來越多。比如某公司收集有1000個人類似的行為,這個資料被另一個公司買去做資料上的分享和研究,是會的,但是絕對不會精細到一個個人的層面。即使美國他們做事情也是非常小心的。

阿裡有安全委員會,我們安全委員會在阿裡來講更多的是平衡開放後的利益和風險。大資料層面很難給出一個答案說這個可以,那個不可以。但是有一個比較重要的是個人的資料隻能給到個人。

吳甘沙:我注意到一家企業是聚信力,通過個人登陸淘寶網站,把他的交易記錄取下來,作為信用的記錄,是以淘寶是允許這樣的做法的。

車品覺:從我的角度來講,如果一個人說保管我的資料,現在要把保管好的資料交給我,我覺得是可以的,因為是我要的是我的資料,沒有個人隐私問題。如果說我拿了資料以後給了第三方能不能幫我做資料分析?我覺得應該是可以的。

吳甘沙:今天跨界對談還有一位嘉賓,馮月先生他是做雷達生意的,是做股票雷達的,下面三位嘉賓可以互相發問。

大資料的roi無法從公司分解?

馮月:我們股票雷達是一家大資料公司,給股民提供實實在在的服務。從創業公司來講我們算是一個在資料方面投入比較大的公司,我們有上百台伺服器。我的問題是,這種大資料對企業來講,怎麼看待roi(return on investment投資回報率)?這個roi的投入是指的大資料研發,包括運維上的投入,而産出并不是銷售多少,而是銷售過程中的提升量。比如淘寶通過大資料成交量從300億提高到400億,我指的是提高的那100億。

我們看到現在的大資料從每一個公司作為戰略層面講一定要實施,像傅盛剛才提到可以三年不考慮收入,但是你不能永遠不考慮收入。像做搜尋,三年之後大量的大公司都說要砍掉自己的搜尋,比如人民搜尋,微軟也在考慮是不是要砍掉bing。我們實踐中不知道二位目前的roi是怎麼樣的情況?

李霈:roi最終還是要看投入産出比,我們目前不會更多的考慮投入産出,大資料投入對我們來說還不夠,還需要很多這方面的資訊。另外大資料很大,可以反複的挖掘,是以價值争取做到最大化。

第三點,從挖掘大資料,短期回報以外更多的還是希望找到消費者的洞察,對寶潔來說,消費者洞察是無價的。

車品覺:這個問題本身是有一些問題的。我們講roi,如果在一個決策層面上是非常難分解一個roi的,做大資料的過程中有很多東西在整個鍊條裡,非常難說加了大資料而有了這個roi。特别因為大資料生産出來的原材料和新資料,對公司有什麼影響?這是比較微觀的。比如今天我們的推薦系統裡會出現一個新的原材料,叫購物性别,實際上不用原來的性别,是購物的性别,是以那個推薦系統增加了兩個點的提升。這兩個點的提升等于多少的價值,是以這是roi。但是很微觀的地方才能講roi,講到宏觀的地方很難講roi的。

吳甘沙:霈總和車總家大業大,考慮的問題跟初創公司不太一樣,現在兩位的講法是資料越多越好,同時選對的資料并不是所有的資料都需要存下來。

車品覺:但是有些資料是可以做的很聰明的,比如小公司利用搜尋可以爬到他的郵件,也可以做大資料的營銷這是很聰明的做法。從大公司來講,不是說我們不做小的東西,其實很多大的創業都是很多小創業在後面推動的。

李霈:我對阿裡大資料非常好奇。開玩笑說,我作為一個從事15年市場研究人員來說,做夢都想到阿裡大資料海洋中暢遊一翻的。在阿裡除了我們看得見的大資料應用,比如說産品推薦、排名、同樣買了這個産品的人還買了什麼其他的産品,有沒有一些在我們看不到的地方,阿裡着重去收集消費者的資料,特别是消費者洞察方面還有哪些呢?

車品覺:最近我看得比較多的是場景,比如使用者購買的時候在移動場景和不是移動的場景的差別。無線已經是很大的占比了,新的使用者行為已經開始了,新的使用者行為是在移動的時候他的行為跟以前不一樣。

李霈:有的時候我們光看購買最後的結果并不足夠,而是整個購買的行為包括他所在的場景串在一起才能給我們真正帶來消費者資料,這個非常有啟發。

吳甘沙:車總您對李霈總有沒有什麼問題?

車品覺:其實也不是問題,應該說從物聯網出身的分析師,或者做大資料的,一般來說對采樣不是很了解,雖然是我們也有一些部門在做一些事情。是以我想知道的是從一個傳統抽樣的做法來講,從他們的角度來講,有什麼大資料的東西是特别需要的?如果我們資料放開給你們用,會對哪些資料特别感興趣?

李霈:我個人覺得,對我來講最有用的,可能是怎麼把資料變成很好的消費者洞察,再從洞察變成實際的行動。我們有時發現一些随機的相關資料時會非常激動,但是最後不一定知道到底怎麼用這些數。比如不同星座的人可能對這個興趣不一樣,但是真正用就不知道了。

過去實踐中,我們也覺得對我們來講最重要的還是要把資料分析和公司的資源合在一起。你擁有哪些生産線和執行力是怎麼樣的,比如我們的産品線有高、中、低端,我研究消費者,希望看到三個層面的消費者行為和平時的做法有什麼不同。研究這樣的變化對我們公司實際行動是非常有意義的。是以如果看到阿裡資料,如何和我們公司目前的運作方式模式合作起來,能夠看到我們在哪些地方有更好的改進。

車品覺:霈總和我們的理念有一個地方很不一樣:網際網路大資料更注意的點不是我能不能判斷這個事情怎麼樣,而是我後面能不能找到他的回路。可能我第一次判斷是錯誤的,但是有足夠的資料告訴我是錯誤的。我們要非常快速的收集錯誤,把原來那個東西去做改正。這點是大家在理念上非常不一樣的地方,因為網際網路很多東西都能收集,是以我做的時候要同時想怎麼樣收集的更精确,如何收集他的更多的情景。

吳甘沙:時間有限,請三位嘉賓用一句話總結一下你們對大資料的期待和看法。

車品覺:還是想跟大家說的是,無線的資料越來越重要。我們要花點時間去想想,當無線的出現對整個大資料有什麼影響?大資料底下的資料已經産生了非常大的斷裂,如果今天不去思考,無線會影響資料源的收集,原來pc為來源的大資料和無線為中心的大資料采集點,它們之間有什麼變化,這都是需要思考。

場景在變,以前有一部pc鎖定了你的位置。今天移動來了,你們的場景變化非常大,你是從一個電影院出來,還是剛吃完飯出來,整個場景變化是非常大的,是以它所收集資料背後的原因跟場景非常不一樣,這也讓底層的資料變得不一樣。

今天還有另一個點就是我們要觀察,有一些資料其實過了一段時間就沒用了,有些資料永遠要收集,你怎麼做判斷?

李霈:消費者是老闆,我希望用大資料的方法把老闆的服務的更好。大資料很美,但是怎麼用确實很難,我希望跟業界同仁一起研究、探索,更好的把這個東西用起來。

馮月:我覺得未來大資料會落地,落到各個行業。之前看到大資料都是在銷售領域,比如淘寶利用大資料提高銷量,或者每一家企業我們看到網絡上現在創業公司十家做大資料的,有七家是做社會化營銷,精準投放的。我們覺得未來大資料會慢慢的應用于各個行業,比如說幫助生活更加智能,幫助個人健康系統更加智能等等。

吳甘沙:從幾位嘉賓聽過來,大資料應該真正解決我們的問題,大資料需要接地氣,大資料不是宏觀的行為,我們更多的應該是關注小資料,關注對每一個使用者的行為改變,以及對他的洞察。謝謝各位,今天關于大資料行為洞察對話到此為止。謝謝!

<b></b>

<b>原文釋出時間為:2013-12-25</b>

<b>本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号</b>

繼續閱讀