天天看點

最新大資料行業鳥瞰圖及解讀

最新大資料行業鳥瞰圖及解讀

原标題:matt turck:大資料行業資訊圖以及一些思考

本文來自潘星鍵投稿(@星鍵v;微信:akavir),他在湯森路透從事資料品質分析工作近7年,文章編譯自matt turck《the state of big data in 2014: a chart》,matt turck曾任bloomberg ventures常務董事,現為firstmark capital合夥人。

從我第一次嘗試為繁榮發展的大資料生态系統繪制一張資訊圖已經過去了兩年, 而這期間大資料行業發生了很多巨大的變化。 我早就該對這張圖做一個更新,現在終于完成了。

從vc的角度,我想談談對這張圖以及大資料行業的一些想法:

越來越擁擠:創業者們蜂擁至這個行業, vc們将大筆的資金投資到看起來有機會成功的創業公司,其結果是,這個行業正變得越來越擁擠。 一些類别如資料庫(不管是nosql還是newsql)和社交媒體資料分析正趨于成熟,且開始出現并購或者淘汰出局(twitter對bluefin和gnip的收購可能意味着在社交媒體資料分析領域這種趨勢早已經開始了)。

對于後來者來說, 雖然空間依然存在,但看起來早期的大筆風投資金都下注在基礎設施(infrastructure)和分析(analytics)領域,導緻成功的标準變得越來越高。 不過, 這并不意味着vc的資金會停止流入這些領域。

對于一些領域,公司的數量之多顯然已經達到了一張地圖所能容納的上限。 我相信還有一些不錯的公司我們沒能納入進來,也許是我們沒有發現,也許是因為地方不夠了, 我在此表示非常抱歉, 同時我也希望大家在評論裡對于應當納入那些公司提出回報和意見。

尚處在早期階段: 總體而言,這個市場還處在發展的早期階段。 過去幾年, 一些被看好的公司失敗了(如drawn to scale),一些公司的創業者提前退出了(例如precog、prior knowledge、lucky sort、rapleaf、nodeable、karmasphere等 ),還有一些的結局稍好(例如infochimps、causata、streambase、paraccel、aspera、gnip、bluefin labs、bluekai)。

與此同時,一些公司看起來正越做越大,并獲得大筆驚人的風投注資(比如mongodb已經融資超過2.3億美元, palantir融資近9億美元, cloudera近10億美元。一些大公司正積極出擊進行并購(oracle收購bluekai, ibm收購cloudant),但是總體而言,多數公司離成功實作ipo和投資者功成身退還差的很遠(雖然splunk和tableau做到了)。 在很多類别,創業公司和大公司互相競争,但并沒有出現市場上司者。

市場宣傳遭遇現實:在經曆這些年狂轟濫炸的市場宣傳之後,大資料還是焦點麼?未來幾年,也許大資料不再是媒體的熱門,但對于大資料市場而言卻是至關重要的, 因為企業将要開始把大資料項目從試驗轉而全面的部署實施。

雖然這意味着一些大資料提供商的利潤會迅猛增長,但同時這些項目也将成為大資料是否能帶來它所宣傳的價值的一塊試金石。與此同時,随着“物聯網”行業的迅速崛起,資料将會如潮水般加速增長,進一步推高市場對大資料技術的需求。

基礎設施:hadoop似乎已經奠定了其作為整個大資料生态系統的關鍵部分,一些競争者依然雖在, 這一領域也許會進一步發展和整合。 sprak是另一個的基于hadoop分布式檔案系統(hdfs)的開源架構,它試圖填補hadoop的弱項,提供更快的的資料分析和良好的程式設計接口,目前正吸引大量關注(一些迹象顯示它做的還不錯)。

一些主題(比如實時資料處理)依然是重中之重,同時新的主題也在不斷湧現(比如新一代處理、變換、清洗資料的工具,包括trifacta、paxata 和 datatamer)。 企業資料是否會真正的放到雲裡(公共雲或私有雲),如果是,還有多久才發生,将是另一個大的話題。很多人認為财富500公司在接下來的幾年來會繼續把資料(以及處理資料的軟體)放在機房裡。一批雲服務+hadoop的創業公司則認為長期來看,所有的資料最終都會放到雲中。

分析工具:從創業公司和vc投資的數量來看,這一領域最為活躍。從excel表格式的使用者界面,到時間軸動畫和3d動畫, 創業公司提供各種各樣的資料分析工具和使用者界面,而不同的客戶也确實有不同的需求,是以這一領域大概依然有足夠的發展空間。

推廣産品的政策也不盡相同 — 有些創業公司更針對于資料科學家,這群人目前不多但增長迅速。 另一些則正好相反,他們銷售自動化的解決方案給一般商業使用者,完全忽略資料科學家的存在。

大資料應用: 正如之前預測的,大資料緩慢但的确朝着應用層面發展。 這張圖列出了一些令人興奮的創業公司——他們本質上都是基于大資料技術和工具(當然我們無法把所有的相關公司都在這裡列出來)。一些公司提供橫向應用——如基于大資料的營銷系統,客戶關系管理系統和欺詐甄别解決方案。

金融業和廣告科技業一直是大資料推廣的上司者和最早的擁趸,甚至早于大資料被稱作大資料。慢慢的,大資料推廣到各行各業,如醫療行業和生化行業(特别是基因研究領域)和教育行業。現在才剛剛開始。

特别感謝我在firstmark的同僚sutian dong,她為這張圖做了很多的基礎工作。以及我在彭博beta的前同僚shivon zilis,他對這張圖的之前版本做了巨大的貢獻。

原文釋出時間為:2014-07-07

本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号

繼續閱讀