天天看點

誰是王者?百度、阿裡和騰訊的大資料發展路線和差別

本文轉自36大資料,已獲授權。作者:麒麟。

看中國科技企業發展,先看BAT。

三家公司各自占據自己的領域,成為了無數小公司歎為仰止的高山,在大資料的領域裡,又尤以BAT最為耀眼。

誰是王者?百度、阿裡和騰訊的大資料發展路線和差別

在前不久的一次公開會議上,李彥宏、馬雲、馬化騰又對資料的應用産生了公開分歧,三者分别認為資料的價值在于算法、資料量、場景化,這其實是暗合了三家公司的經營方向與理念。百度掌技術,阿裡重規模,騰訊把持着社交與遊戲,是妥妥的三種企業文化,三個經營方向。

今天就來講講三者的交叉與差別。

百度大資料——到底是半壁江山還是黃埔軍校?

百度公司是一家妥妥的工程師文化公司,素來就有“資料為重,不為上”的傳統。

誰是王者?百度、阿裡和騰訊的大資料發展路線和差別

百度大資料産品

作為BAT三家中資料量最大的公司,百度的大資料其實起步是最晚的,自2014年4月24日起,百度正式宣布對外開放“大資料引擎”,包括開放雲、資料工廠、百度大腦三大元件在内的核心大資料能力開放,通過大資料引擎向外界提供大資料存儲、分析及挖掘的技術能力,将面向多個傳統領域逐漸開放。同年8月18日,聯合國與百度宣布啟動戰略合作,共建大資料聯合實驗室(bdl)。據悉,聯合國開發計劃署與百度大資料聯合實驗室的目标是探索利用大資料解決全球性問題的創新模式。

百度在開發和營運一整套自主研發的大資料引擎系統,包括資料中心伺服器設計、資料中心規劃和設計、大規模機器學習、分布式存儲、超大規模叢集自動化運維、資料管理、資料安全、機器學習(特别是深度學習)、大規模GPU并行化平台等方面,百度“大資料引擎”具有先進性和安全性。

現在的百度從大資料出發,在2012年餘凱先生(已離職)的提議下,成立了深度學習實驗室(IDL),後曆經數位大牛操刀,已經成為了國内AI技術的标杆實驗室,并成為了李彥宏未來藍圖中百度的重要押寶方向。

目前驅動中國人工智能向前發展的上司者中,隻有寥寥數人出身于高校和研究機構,絕大部分都來自中國頂尖的科技公司,其中中國網際網路三巨頭BAT(百度、阿裡、騰訊)幾乎包攬了剩下的名額。而在這些人裡,百度占據了近一半的名額,說百度撐起了中國人工智能領軍人物的半壁江山并不為過。

可以說若論AI人才儲備,百度就是中國AI中的霸王,對于中國AI而言的百度,最近網上有人戲稱之為“中國AI黃埔軍校”。

這個說法自然有些戲谑,但毫不誇張。

《福布斯》也在今年初釋出的另一份報告中指出,百度将自我學習、神經元網絡技術融入了核心的搜尋業務之中,實作經營方式的創新,也許會成為新的增長點。

百度基于自己的搜尋引擎,其資料具有廣而不精的特點,與現有技術相結合,目前被百度拿來盈利,最多的是“鳳巢”系統的精準營銷。

阿裡巴巴大資料——電商是其魂,雲為其靈

照常理說,BAT中,論大資料,唯獨是談不到阿裡的,因為阿裡起初的技術基因是最弱的,也不是資料量最大的。但現在若論雲計算,偏偏阿裡又是最強的。馬雲先生和王堅博士的高瞻遠睹,甚至逐漸讓人嗅出了一絲論老練能強于貝佐斯的味道。(日前,Amazon已經成為了世界第一大雲服務商,阿裡位列第四)。

誰是王者?百度、阿裡和騰訊的大資料發展路線和差別

阿裡大資料産品

早在2014年時,馬雲就提出了DT(Data technology)時代的概念,隻不過當時和更早的20年前一樣,人們不過覺得這個小個子在吹牛罷了。

但這位小個子首富的眼光不可謂不獨到,讓阿裡的大資料成了BAT中起步最早的。

阿裡大資料有兩個起源,一是始于電商,二是始于阿裡雲。

不光是大資料始于電商,阿裡整個公司都始于電商,電商是阿裡大資料之魂。

起初阿裡的資料産品名為“量子恒道”(現已更名生意參謀,專為淘寶賣家分析資料使用),可以說阿裡對于大資料的認知起點就是始于這個電商資料分析軟體的。從2008年起,阿裡就把大資料作為一項基本戰略,這樣的意識完全是阿裡在電商領域裡嘗到過甜頭。所謂的資料魔方也好,淘寶指數也好,都是始于“量子恒道”的。

另一個起源是阿裡雲,阿裡雲是阿裡大資料之靈。

阿裡雲創立于2009年,截至2016年第三季度,阿裡雲客戶超過230萬,付費使用者達76.5萬 。在天貓雙11全球狂歡節、12306春運購票等極富挑戰的應用場景中,阿裡雲保持着良好的運作紀錄。

2016年1月20日,阿裡雲在2016雲栖大會上海峰會上宣布開放阿裡巴巴十年的大資料能力,釋出全球首個一站式大資料平台“數加”,首批亮相20款産品,這一平台承載了阿裡雲“普惠大資料”的理想,即讓全球任何一個企業、個人都能用上大資料。阿裡的大資料團隊——數加,就這樣誕生了。

魂與靈的結合就是數加的産品商業化十分成熟,且極其符合中國商人的口味,在資料可視化上,其推出的大屏功能最受歡迎(靈感來自雙11)。畢竟中國企業服務的兩大要點到在這裡了,視覺沖擊足夠大,足夠滿足管理欲。是以數加産品除了夠商業,同時也夠“中國”。

在這樣的背景下,數加團隊越發的朝着可實時性、可解釋性、資料準确/穩定性發展,進而由電商為始逐漸涉及到制造、金融、政務、交通、醫療、電信、能源等衆多領域。

在輸出自身大資料能力的同時,“數加”還向有資料開發能力的團隊開放。這些團隊可入駐“數加”,借助數加上的工具為各行業提供資料服務。“數加”平台首批集中釋出了20款産品,覆寫資料采集、計算引擎、資料加工、資料分析、機器學習、資料應用等資料生産全鍊條。

就像在淘寶開店一樣,隻是他們售賣的是專業能力。

騰訊——大資料是騰訊遊戲的秘密武器

馬化騰這個人特别低調,低調到整個騰訊都學了他“悶聲發大财”的路子,很少有相關消息或者報告面世。

誰是王者?百度、阿裡和騰訊的大資料發展路線和差別

騰訊大資料産品

但實際上在2009年1月,騰訊就搭建了第一個Hadoop叢集,到2010年6月的時候,TDW v0.1版就釋出了。

騰訊坐擁社交資料、遊戲資料、交通資料、輿論資料等等,是場景化非常高的資料。

其中的社交資料,是騰訊自身最擅長的東西。如果騰訊願意,它甚至可以通過分析得知,你的社會關系、性格禀賦、興趣愛好、隐私绯聞甚至生理周期和心理缺陷。

騰訊的大多數消費資料都來源于遊戲與增值服務。騰訊遊戲的收入十分暴利,遊戲迷們總是願意付出高昂的費用來購買虛拟道具,以此滿足自己的虛榮心。(據報道,王者榮耀第一季度流水達100億人民币)

騰訊大資料的應用目前主要是為了完善自家産品,它了解使用者的性格禀賦、興趣愛好、隐私绯聞甚至生理周期,通過這些資料分析得出結果預測,做出來的産品能不受歡迎嗎?事實上騰訊遊戲的開發,以及一些産品的改進,也正是基于這些資料進行,其應用方法類似《紙牌屋》。

這使得騰訊遊戲的發展産生了“馬太效應”,坐擁海量遊戲資料,做針對性的開發,然後繼續完善資料,再開發新遊戲。

當然,現在騰訊大資料也早就對外開放了,在2016年還拿了Sort Benchmark排序賽冠軍,破了四項世界紀錄,98秒内實作了對100TB資料的排序,技術實力也是不容忽視的。

三強的交叉點

大資料并不是報表平台、也不是計算平台,更不等同于精準營銷。關鍵還是要看應用。

在大資料閉環系統中,萬事萬物都是資料産生者,同時也是資料的使用者。這就需要有大量能互相連接配接的的資料,在一個大資料計算平台,有相同的資料标準并能産生關聯性,通過大資料相關處理技術最終形成自動化、智能化的閉環系統,自動學習,智能調整,進而提升整體的生産效率。

三強的資料量,目前是百度最大,騰訊次之,阿裡最小,但阿裡的資料變現做的最好。

三強目前的較量除了關起門來研究技術提升自身實力,也在其他領域裡頻頻出手進行資料争奪,百度地圖、高德地圖、騰訊地圖莫不是如此,前段時間的菜鳥物流與順豐事件,也是阿裡和騰訊對物流資料争奪的一個縮影。

三強面對的未來也許是三岔路

說出來你可能不信,國内最早研究大資料的,是在06年左右的暴風影音。但暴風影音隻是搭建了一個大資料的架構,并沒有對資料本身進行落地應用。

國内除BAT以外的,能說的上在搞大資料的,大概也就是三大電信營運商和銀聯這些央企了,這些公司和前一類公司的不同點在于他們已經有海量的資料,并且有足夠的技術能力和财力。但此類公司目前的研究重點是國家戰略的方向,在商用友善考慮較少,加上國企的一些常見病,對大資料的核心分析能力掌握不深,或者是沒學習動力,基本是在等别人搞完了再拿過來。

是以說歸根結底大資料還是得看怎麼應用。

這才有了三強争霸的局面,日後的三強也是一樣。

阿裡的資料量雖然最小,但有高度商業應用價值,而且多數是結構化的資料。百度和騰訊的資料量都比阿裡多很多(準确說,高出了數量級)。騰訊是以社交和遊戲為主,而且基本給内部用。百度則是量最大的,主要是為提高使用者的搜尋體驗和廣告主的精準營銷。

說到底,三家的差别主要是資料來源和商業用途上的差别,核心能力差不多,都基本可以靠Hadoop搞定半結構化資料。

三強面對的不光是彼此,還有國門外的世界,也許100年後的曆史書上既不會提奧巴馬醫改,也不會寫川普有性醜聞,但一定會濃墨重彩地寫上從2014年起中國上司人決定走可持續發展的道路。

如今的三強正走在趕超GooGle、Amazon等矽谷企業的路上,他們彼此間的競争其實也是面對新對手前的熱身,在吃招喂招之間成長,而不是着眼于彼此。看看最近新聞上的三強在做什麼就知道了。

誰是王者?百度、阿裡和騰訊的大資料發展路線和差別

阿裡忙着去美國底特律開會,買加拿大龍蝦帝王蟹,簽支付寶國際合作協定;騰訊在忙着收購遊戲公司,部署雲計算基地;百度在家裡憋大招苦修人工智能,無人駕駛。

可以說現階段的三強間的摩擦都是一些小摩擦,各自其實都有着明确的路線藍圖,現階段的摩擦不過是為了拿更多的資料喂食自家産品以及在新領域裡做做探索罷了。

他們真正的的征程是走出國門迎戰Google, Amazon,Microsoft,并且取而代之成為新時代的科技巨頭。他們之間的格局最後也會變成Google, Amazon,Microsoft之間這樣,既競争,也彼此包容,既保持警惕,又不能自制的互相欣賞。

現階段三強和海外巨頭的大資料領域主要差距還是在對資料分析的基礎研究上和大資料分析人才儲備上(國内在大資料人才數量和品質上都和美國差的并不是太大,但畢竟起步晚了)。但大家的發展方向和架構沒有本質上的差别。

十年前,拿三強和Google比,會有人讪笑,今天再拿三強和Google比,每一個國人都可以像新聞外交部發言人一樣一本正經的說“那是曆史的必然選擇”。

更多精彩,歡迎關注CSDN大資料公衆号!

誰是王者?百度、阿裡和騰訊的大資料發展路線和差別

繼續閱讀