天天看點

國内外大資料創業面面觀

大資料分為廣義和狹義兩個概念。廣義的來講,所有的網際網路公司都有自己的資料,因為它們有很多使用者,以及使用者沉澱下來的資料。它們也有自己的資料部門,大的網際網路公司會拿這些資料做一些變現。狹義的來講,其實大資料更多的定義是第三方的公司,它幫助在市場上有需求的客戶收集以及利用資料。

今天想着重講的是狹義層面上的資料概念,就是說我想為大家介紹一下國内外大資料創業領域的标杆性公司,以及它們發展的情況。

大資料在企業應用中的構成

大資料在企業應用中分成五個大的部分。先有底層資料基礎,才有分析層面的東西。

國内外大資料創業面面觀

2014年全球大資料創業公司

1.infrastructure

第一個大的子產品叫infrastructure(基礎設施),也就是說我們平時用到的雲計算、儲存設備以及資料庫等,這些都是基礎的東西。資料源的存儲和處理需要載體,通常是硬體或是虛拟化裝置。

2.datasources

第二個是資料源,這是大資料的基本原材料,我們必須要有資料才能夠提取資料中的價值。

3.opensources

opensources(開源方案)包含算法、資料轉化、結構化處理等功能,相當于一個中間件,它是連接配接了資料源和基礎架構,再把資料做結構化的處理。

4.analytics

最廣泛的應用場景就是analytics,就是分析類,比如大家經常提起的的bi,我們企業内部有各種各樣的資料,怎麼樣通過工具或者是軟體把這些資料呈現出來,在這個領域有各種各樣的細分。比如說有專門做非結構資料處理的,有些專門做資料可視化的,還有一些可能是針對某些垂直領域的。

5.applications

最後一類是應用類,它們融彙了大資料與各垂直細分領域業務邏輯,提升價值,比如金融業、房産業、醫療業、汽車業、等等。

根據這五大類,相繼有一些創業公司。我自己調研發現從2008年到2014年是大資料在美國創業的風口。從2012年到2014年出現大資料行業突破性的變化。可以看到,每一個細分領域的公司有非常大的量級上的增加。

國外大資料退出案例

截止到2014年底,國外在大資料創業公司一共有358家,但是隻有16家退出。分析層面退出的案例最多,資料源、基礎設施方面也有幾家。

1.analytics

karmasphere:是做資料處理的公司,它給企業提供了非常基層的資料分析工具,提供給資料科學家用的。也就是說,它的使用者是具備對資料有一定的了解和處理能力的人,它提供一個工具和接口,把一些企業裡面非結構化資料搜集過來,去做一些最基本的結構化處理,資料科學家再通過自己擅長的各種模型,去利用這些資料。

tableau:它做更加傻瓜的資料可視化。也就是說,它直接繞開資料科學家可以直接提供給相對小白一些的使用者,有些中型企業它們沒有資料科學家的職位,他們可以直接用tableau,免去資料采集、處理、模組化的繁瑣步驟,很簡單快速的部署到企業内部,一目了然與自身業務、經營息息相關的實時情況,比如說:使用者的購買率、轉化率等等。

國内外大資料創業面面觀

palantir:它雖然還沒有上市,它如今卻是與airbnb并駕齊驅的百億獨角獸之一,它是發展最迅速并且融資規模最大的大資料公司,已經融了9億美金。它的競争優勢在于提供了全産業、并且超定制化的資料服務,它不僅僅有自己第三方的資料源,同時也具備資料分析、saas可視化的服務。是以它是非常有核心競争力的公司,産品的厚度相應是非常堅實的。

bluefin:它現在已經被tiwtter收購了,它在美國是做社交資料起家的。如果大家想收集某些有關品牌、事件、人物的情報,其實最直接的資料源頭就是社交平台,因為人們與社交媒體的互動是最為頻繁的

。是以bluefin這家公司創業之初就采集了主流社交平台的資料,比如利用我們常說的爬蟲技術,采集對于某一些特定關鍵詞的評論,再做分析。其實有點像輿情檢測跟輿情分析。這個在國外是非常普遍,在早些年前已經被很多企業重視。因為國外自主品牌相對比較多,他們很早就開始注重營銷這方面的東西。是以這個公司起步也比較早,最後退出的也比較快。

splunk:還有一類就是it運維方面的分析,這個公司在國外最成功的案例就是splunk,這個工具是提供給内部it部門運維人員的,因為運維人員每天要關注系統運轉的穩定性和安全性,他們要處理很多機讀語言的非結構化資料,這個可能跟公司管理或者是跟業務沒有太大關系,但是it資料非常重要。主要的原因是,如果it系統一旦崩盤可能會影響到網站的營運,對于大型企業來講,可能就是損失掉了一筆巨額的收入。

2.applications

rocketfuel:在應用層面,國外在2015年新增了幾家新的退出案例,我還沒有完整的總結。2014年,隻有一家叫rocketfuel,這家有點像國内的秒針,它是針對做廣告優化精準營銷的。因為大資料在應用場景層面,其實最頻繁被用到的還是智能營銷,因為營銷是最簡單粗暴的訴求:離錢最近的,打廣告,直接找到精準的客戶,直接給客戶帶來收入。這塊國内跟國外是一樣的情況。

3.datasources

bluekai:剩下的幾個基礎方面的資料源,以及開源資料,基礎設施,它不算是非常熱門的創業領域。是以相繼在國外退出的案例也沒有那麼多,尤其是資料源這塊,國外有一家叫bluekai,它也是偏向于營銷,主要是給企業的營銷部門提供第三方資料源,有點像資料集市。

4.infrastructure

paraccel:在基礎設施方面還有一家paraccel是标杆性的公司,它是做資料處理的,把非結構化的資料轉化成結構化的。很多企業不做精細化營運,但起碼資料存儲還是要有的。

新銳大資料創業公司

剛才提到的都是一些退出的公司,這一頁上是我自己篩選出來的,我覺得這兩年在美國創業市場比較新銳的公司。

taboola:也是做精準營銷和營銷優化,但是它不太一樣的是它內建了更多人工智能方面的東西。

localytics:它跟傳統的資料分析不太一樣,比如tableau做的主要是大型或者是中大型的客戶,中大型客戶有比較現成的資料庫,比較現成的結構化的東西。但是localytics更輕,主要針對很多sme,就是中小型的公司,包括創業公司,它自己有靈活的資料庫功能,一個新的創業公司即使沒有搭建資料庫,也可以很快的部署,在應用上可以看到使用者的情況和行為表現。

mixpanel:跟localytics比較類似,都是比較新銳的創業公司。

app annie:大家比較熟悉了,用于分析應用中的使用者行為資料。

data hero:今年已經成功退出了,這也是一家成長非常快的公司。

evrestring:是華人自己做的公司,是真格投的,它利用了資料,幫助企業找到核心潛在客戶,算是一個銷售線索公司。但是他們非常厲害的是,他們能夠把很多資料孤島串聯起來,幫企業找到最精準的使用者群體。

大資料創業增速緩慢

國外截止到2014年底有358家大資料方面的創業公司,退出的隻有16家,包括并購和上市,而且并購占到了80%,上市隻有20%。從比例上來看,4.5%的退出率對于一個創業方向來講其實是很低的,而且從速度上來看,也是相應的比較緩慢的。

究其原因,我覺得不管是在國外或者是在國内,大資料應用場景的不成熟,以及有能力使用大資料的人才(資料科學家)匮乏,始終是阻礙大資料發展的原因。

國内外大資料創業面面觀

從現有統計看,分析工具其實是占比最高的,不管是在融資情況或者是退出方面。第二名是基礎設施,我剛才說了,因為所有公司都有存儲資料的需求。然後是垂直細分領域,排名最後的資料源,像開源資料其實是最難變現的。是以到現在都沒有很好的退出。

大資料創業熱門領域

最熱門的三大領域:資料分析、應用和基礎設施。從2008年到2012年,資料分析工具越來越多,不管是融資金額,還是案例數上。基礎設施機會越來越少,因為這塊肯定是先有一個培育的土壤,才能有後面分析的東西,是以這塊的創業機會越來越少。

在應用場景這塊,可以看到中間多出來很多,後面也變少了。我們來看不管是投資人或者是創業公司,可能在2009年到2010年都是想象的階段,不知道這方面到底能不能好,很多人都一窩蜂的擠進來。後面理智一點的發現,應用場景快速做起來的并不是太多,是以也就相對理性了。

國内外大資料創業面面觀

大資料在垂直領域的應用案例

在垂直領域,大資料在美國已經有的成功案例,包括市場營銷、能源、石油、金融,企業服務裡面最常用到的人力資源hr。因為現在有很多履歷需要通過智能分析去做大資料的關聯。還有就是零售,因為零售行業是産能非常高的行業,是以大資料對它們來說價值非常大。還有就是供應鍊管理、醫療、健康以及房産。

國内大資料創業公司

1.基礎設施

基礎設施領域,國内有一家新銳創業公司叫博睿資料,他們是做資料庫的。我個人認為,在基礎設施領域,尤其是資料庫方向,在國内的創業機會很少。因為這個東西不太需要再引入中文版或者是中國獨特的東西。因為用國外現成的工具就可以解決問題了。而且現在有很多開源,也是免費的,這塊在中國的創業機會不是太多。但是也有一些新興的方向,比如說做資料壓縮、資料檢索等,這種相對比較細分,也比較新興的領域,這些方向可能還有機會。

2.資料源

我自己認為資料源方面創業公司确實沒有什麼機會了,首先資料方面創業公司都做的比較大了,比如說資料堂是做資料集市的,這些公司都已經到b輪了。最大的像資料魔方,阿裡媽媽等,是阿裡旗下的産品,巨頭在這個領域會有優勢很多。

3.分析類

分析類目前還處在起步的階段,目前我看到可視化的機會,阿裡前幾天剛剛推出了叫數說,它們是做可視化的,以後會提供給各種各樣的客戶,包括政府或者是中小型公司,以及大型的民營企業。可以看到,隻要你對你的分析方面有需求,隻要資料源導進來,他便可以自動的做歸類和分析,并且智能化的形象展現。這個領域的創業公司有星圖和海雲,我把資料庫導進來可以看很多公司的動态。

剛才我們講的大而全的分析平台,既具備資料處理能力,又具備可視化,現在行業裡面非常标杆的叫永洪資料。我覺得永洪非常強大,因為它們跟國外的tableau直接對标,是我目前看到的做資料處理、可視化分析,并且跟客戶的業務邏輯緊密結合非常成功的公司。

後面除了分析平台之外,精準到使用者分析又有兩家公司已經做的比較大,就是talkingdata和友盟,我們覺得做使用者層面資料分析創業公司機會不多了,友盟被阿裡收購了,是以空間并不是特别多。

下面這一類,這是我特别關注的,我覺得在國内資料類創業公司裡面最有機會,就是有點對标國外大資料創業公司,像神策網絡、growingio、達觀資料,你有資料庫可以非常靈活,你沒有資料庫我可以幫你引入一些外部的。在收費模式上也是saas的模式,比較輕。但是也存在一個短闆,可能它們的目标群體,也就是中小型客戶的付費意願沒那麼強,客單價低。

還有像百分點,它是做智能算法、廣告優化的。像應用類下的智能營銷,我自己覺得在國内機會不多,做廣告優化,除非你是從pc領域轉到移動領域,不然的話機會真的不多。因為現在這幾家公司都是c輪以後或者是快上市,或者是并購的結構了。

後面還有一類我也特别關注,it這塊像日志it運維分析,因為我自己對it方面非常感興趣,國内比較成功的幾家hansight、日志易、oneapm,還有陸續針對特定類型客戶的公司,比如我正在做的一個項目,針對大銀行、營運商機構的protoco soft。

4.應用類

最後一類應用類垂直到不同細分領域,我覺得都有機會。尤其有機會的是市場營銷和銷售線索領域,因為這個離錢近,可以直接給企業帶來好處和利益的,我覺得這塊是最有機會。再精準到細分裡面,資料應用場景最成熟的可能是電商營銷或者是社交資料,或者是社交crm,這些方面都有很多機會。還有就是安全、醫藥、金融都會有機會。雖然垂直應用層面可能有機會,但是如果已經有人做建議慎入,本來這個市場相對比較小,進入之前也必須看看競争對手已經做到了什麼程度了。

總結:

追溯國外的大資料市場行情,發展還是相對緩慢的,并且這個情況也可能會發生在中國。

無論是在國外或者是在國内,大資料應用場景的不成熟,以及有能力使用大資料的人才(資料科學家)匮乏,始終是阻礙大資料發展的原因。但是,大資料為人類提供的價值不可估量,一旦爆發會是指數性的增長。技術驅動型的創業也将是下一個風口,我們還是要對這個領域持續保持關注,并且鼓勵專業人才投入到建設大資料創投生态中來。

本文轉自d1net(轉載)