天天看點

你對大資料的認知,也許都是錯的

你對大資料的認知,也許都是錯的

  大資料并不是在大,而是有用。

本文作者汪祥斌:騰訊系創業者,大資料公司DataEye創始人&CEO,這是大資料觀察系列第一篇。授權首發于南七道公衆賬号。

自從美團王興提出移動網際網路下半場的概念後,大家在談論每一個行業時,都要提到下半場,包括大資料行業。大資料的概念在這幾年,火爆程度不亞于AI、VR等概念。

但是,作為一個大資料創業者,在談大資料的下半場之前,現在網際網路界對于大資料這個概念有太多誤區。你所知道的大資料的概念,也許都是錯誤的。

大資料并不是在大,而是有用

首先,大資料并不在于其大,而在于品質,用通俗的話說就是有用。

大資料是一個比較泛的概念,大資料其實不是強調資料有多麼大,而是有用。有用的資料才能稱得上是大資料,有用就包括了規模、品質等各種綜合性屬性。

所有的資料都必須深度地與業務揉合。換句話說,創業者憑空想象的大資料模式一定都是虛假的。沒有做過這個具體業務的人去談合作,說如何幫到别人,這都是忽悠。

這個行業裡有太多不可描述的事情,靠這個忽悠吃飯的人太多了。大資料領域,精準營銷是一個被提及到最多的概念,沒有之一,理論是大資料可以支援精準營銷。大家都知道大資料需要規模,所有外行人看到的就是,你有這麼多資料,是以你這個就是精準營銷。但是忽視了一點就是,真正到精準營銷前還有一個在中間隔着的,不是規模而是品質,而最終落地在效果。

這裡面大家很容易忽視一點,就是大資料要做到支援精準營銷,這裡面對大資料是有約定的,資料的品質和規模同比都能達到的情況下,才可以實作。

規模在大資料這一行目前看做到不難,難在品質,而且品質是難以逾越的一道天塹。如果說DataEye從頭再來,2年内隻做到現如今的覆寫我覺的依舊沒什麼難度。但是,這種覆寫所獲得的資料,能不能支撐所謂的大資料精準營銷,這是關鍵。沒有品質談資料的商業化都是扯淡。

以遊戲行業為例,在遊戲裡做大資料營銷,或者放大一點在移動網際網路做大資料的精準營銷,其實收集的不外乎是人的一些行為資料。但真正能支撐你到後面變現的行為才是有效的,但這點并不是每個行為都能支援的。

是以在大資料行業裡,無效資料和資料品質的監測是很重要的,這個我覺得是下半場的核心。它會影響每一家資料公司資料變現的效率,變現效率将會是下半場的賽點。

在接下來,如何高效地獲得有效資料這對創業者的門檻将變得非常高。很多資料服務,比如說統計産品,不是拿到的資料都有效,我認為很多統計産品拿到的資料是無效的,甚至是沒有任何商業化的價值。

創業者要關注自己最終資料商業化的落點在哪,如果是精準營銷,什麼樣的資料是有效的呢?在這其中,高品質客戶的行為資料對精準定位肯定是有效的。比如要推銷一個潮品,你需要的使用者不僅是個消費能力強的,而且是很潮的人,那麼他就是一個高品質的資料。換句話說,如果産品都不能覆寫這些人(你商業落點的客戶全體),覆寫的都是一些六七八九線城市的使用者,這時候創業者跟投資者說看見沒有,我有一兩億使用者移動端行為資料,其實商業化根本無從談起。是以我說的商業落點很重要,因為隻有知道落點在哪你才知道你的資料品質該如何提升,究竟缺什麼,該設計什麼樣的服務産品。

是以大資料的下半場,争奪的就是商業化效益,其中關鍵是資料品質的競争。但想要高品質的資料或者高品質的客戶,你就要提供高品質的服務産品,才能完成高效高質的資料積累。高品質的資料依賴高品質的業務,高品質的業務依賴于高品質的産品,三者相輔相成。

比如現在遊戲行業買量、導量成本高了,于是需要更多的服務。開始創業的時候我們做了個産品叫廣告監測,這個産品很簡單,到16年之後就沒怎麼推了。因為我們覺得這個産品門檻很低,而且客戶自己都能解決,很多客戶已經自己解決了。有中小客戶解決不了的,他可能用第三方。那在這一點上,我們必須提供高品質的業務或者産品。我們今年在産品布局就整個提升一個檔次,提升整體資料品質,提升服務水準。

資料是客觀的,也是最不客觀的

在理論上來說,資料是最客觀的,因為拿到的這些資料,都是通過裝置等各種管道采集的。但同時這也是最不客觀的,因為人工可以幹預并篡改。

在中國,純粹的規模和量級很容易達到,有些人客觀達不到,就通過主觀的各種手段,哪怕是造假也很容易達到。是以說,資料規模這不是一個特别好衡量的東西,聽上去太虛了。到現在為止,還會有些創業者喜歡說,他們覆寫的裝置數量,然從十億到幾十億台,甚至有的人說自己都快上百億了,我在知乎裡提過一個問題:請問中國的營運商一年入網多少台裝置啊?大資料創業者太多,裝置有些不夠用了。

從騰訊離職,到現在我做大資料這麼多年,随着項目的不斷發展,對資料的感覺越來越深刻,資料這個東西真的很有意思,如果說它客觀,它可能是這個世界上最客觀的一個存在。但如果說它虛吧,它也最容易被修改。現在各行各業開口閉口都是資料,但是大家有沒有想過,這個資料随時可以被修改。

這點不友善太展開說,具體原因你懂的。

這個階段大資料核心不是技術,而是商業化

大資料創業到現在,決定最終發展的,其實不是大資料的技術,而是大資料的商業化。

上半場結束了,下半場競争的是什麼,我們确實一直在思考。想來想去恐怕就是商業化了。對資料源來說,不是比誰會忽悠,比的是誰更能賺錢,誰的變現效率更快。

不懂商業的創業者,一定是會墊底的,把大資料的坑填平的。中國不缺資料技術型人才,缺的是資料商業化人才。怎麼樣結合資料把它商業化,把這生意做好,這個是中國最缺的。

不僅是大資料,可能各個行業都是這樣,現在缺乏真正的商業化。前面競争已經基本結束,但真正走向商業是一道大坎。15年我在矽谷待了一段時間,見了很多以前在騰訊的兄弟,之前騰訊研究院的兄弟在google研究算法有不少,他研究的課題我看了,确實先進,但要說在技術上高多少也不見得,但是大家所展現的商業思維與探索,跟國内确實有比較大的差距。

現在在國外,有專門幫助客戶做大資料商業化的公司。比如我了解的一個海外團隊就是在幫全球各處營運商做資料商業化的。他們在海外做過的商業化的案子,包括門店、營運商、基站的選址,高速公路邊上那種大的立柱廣告的布設等等。

大資料的商業,最後一定是很簡單直接的商業模式,越簡單直接的商業模式越是一個好商業模式。紙面上的模式、資料等,那沒任何意義。實踐很重要,我看過太多大資料案例了甚至有些我可以告訴大家都是所謂的專家臆想出來的,相對于紙面上的案例我更喜歡踏實實踐的失敗例子。

整個大資料的上半場,大家拼概念、拿融資、收資料源,該拿的都拿了,資料源之争到16年基本上就收官了,格局已經形成。接下去的下半場就真的很殘酷了,這拼的真的就是魚死網破了。那下半場大家拼的是什麼?拼的就是邊際效應。既然圈了這麼多人進來,那就得把這個閉環圓上,不然怎麼收場?是以大資料下半場,就是拼變現和效率。創業者能等,投資人等不了。

大資料行業還有很長的路要走。現在很多時候都是看不清的,矽谷的《奇點來臨》說,任何一個新興行業最終都會有一個曲線。一個新興的行業的發展一定都是波浪式發展的,一開始是高速發展,發展完之後進入調整期,然後再沖刺。大資料行業也是如此。當它經曆低谷之後它會再次成長起來,那這整個行業可能就慢慢開始成熟了。而現在,我們處在離成熟階段還有比較遠的距離。

本文轉自d1net(轉載)

繼續閱讀