大資料是企業服務市場中的新興領域,短短幾年時間,大資料概念從興起到落地,開始在各行各業發揮作用,行業政策頻出,技術飛速發展,受到資本追捧。
整個大資料行業可大緻分為三層,底層基礎平台,中間層通用技術,上層行業應用。接下來,愛分析将按照上述分類,逐漸介紹各細分領域的行業現狀、未來前景。今天是大資料系列的第一篇——底層基礎平台。
底層基礎平台主要解決的是資料存儲、計算的問題,是整個大資料生态的基石。采集到的資料,首先要能高效、快捷地存起來,才能進行資料分析和資料挖掘。
這一層非常重要,同時也是技術含量最高的一層。以底層技術中明星hadoop為例,用hadoop的公司很多,能做hadoop發行版的公司鳳毛麟角。
底層基礎平台細分領域裡的大資料公司衆多,有專注hadoop發行版的星環科技、紅象雲騰和天雲大資料,有傳統資料庫廠商人大金倉和南大通用,有研發新型分布式資料庫的巨杉資料庫,還有唯一來自中國的apache社群頂級項目kylin背後公司kyligence。
這裡面最受人關注的hadoop以及由此衍生的公司,接下來愛分析為您重點闡述國内外hadoop生态的現狀。
hadoop興起的原因:便宜才是硬道理
進入新世紀的第一個十年,各大企業都在大力投入it裝置,建設自己的機房,上線各套辦公系統。第二個十年,經濟下行,傳統企業的盈利下降,對it裝置的投入已經不像上個十年那般狂熱,大型企業采購it裝置的經費受到控制,開始核算成本,意圖在滿足需求的情況下,降低投入。
以hadoop為代表的新底層技術能夠興起,抛開技術原因,最主要的原因是便宜、擴充性強。利用分布式架構,将一些性能一般的機器串聯起來,達到與高性能單機同樣的效果。随着公司發展,資料量增大,不需要更換全套裝置,隻需要再增加機器就可以達到目的,省時省力。
分布式架構的技術很多,為什麼hadoop最後勝出?還是因為便宜,用的人多。以微軟的cosmos為例,這套系統本身優于hadoop,主要是針對大型機房,設計理念很好,上萬台機器的機房,拿出幾十台做别的事情,來提升系統營運效率。但如果是幾十台機器,仍然需要拿出很大一部分來做别的事情,機器使用效率就很低。
實際應用時,用上萬台機器的公司少,用幾十台機器的公司多,是以hadoop的應用面更廣。用的人多,自然幫助優化架構的人多,社群貢獻的人多,技術發展快,漸漸成為主流。
國外hadoop三駕馬車,商業模式各有差異
hadoop三駕馬車,資料源:公司公告,愛分析整理
提到hadoop,必然要提到國外三家圍繞hadoop技術的公司:cloudera、hortonworks和mapr。三家公司都成立時間不長,cloudera和mapr都是2009年成立,而hortonworks是2011年從雅虎獨立出來。
三家公司都在資本市場上受到追捧。hortonworks在2014年上市,ipo當天市值接近11億美金;cloudera獲得英特爾7.4億美金的投資,估值近50億美金;mapr最近剛剛獲得5000萬美金融資,估值也超過10億美金。
hadoop技術是開源的,為什麼還有公司會提供hadoop相關服務?這是因為開源技術的相容性和穩定性比較差,同時,企業在實際應用中需要将開源技術和自身系統、産品相連接配接,這就是hadoop發行版的市場所在,三家公司利用自己在這領域的技術、經驗積累,幫助企業更好地應用hadoop技術。
盡管三家公司都是提供hadoop相關服務,但是商業模式差別不小。cloudera和mapr都研發自己的hadoop發行版,隻不過mapr的技術完全閉源,不會對外開放,而cloudera的産品分為免費版和企業版,隻有企業版的核心元件不對外開放,其他技術均提供給社群。hortonworks将自己的技術完全貢獻給社群,不靠産品獲利,靠派駐技術人員到客戶現場提供服務盈利。
因為mapr的技術不開源,是以對社群貢獻有限,目前對apache hadoop社群影響最大的是cloudera和hortonworks這兩家公司。
國内市場處于跑馬圈地階段,新興大資料公司剛剛起步
正如開篇所言,盡管近年大資料行業風起雲湧,創業公司如雨後春筍般冒出,卻少有專注底層基礎平台的公司。
星環科技是業内的明星公司,創始團隊來自原intel開發hadoop發行版的部門,經驗豐富。成立三年,星環科技已完成1.55億人民币的b輪融資,估值超過10億人民币,目前主要服務金融、電信領域客戶。
天雲大資料和紅象雲騰同樣在做底層基礎平台,發展速度略遜于星環科技,都在尋找适合自身的發展路線。天雲大資料的業務在向上層遷移,除了提供hadoop發行版,目前也涉足複雜神經網絡等算法技術;紅象雲騰将業務下沉,基于晶片層提升系統處理資料的效率。
目前,銀行等大型企業紛紛喊出“去ioe”(ibm小型機、oracle資料庫、emc儲存設備),盡管國産企業的産品尚不能滿足大型企業核心系統的要求,但是必然會有大量新業務的it系統采用國産品牌,舊有業務面臨更新換代也會優先選擇國内廠商。
資料庫等底層設施不同于上層應用,更換成本較高,客戶黏性很大,非萬不得已不會進行替換,同時hadoop這類新技術疊代速度快,需要後期維護。是以,各家公司都在大力開拓市場,跑馬圈地。
新興公司服務客戶的方式類似,前期以産品為核心,用項目制的形式幫助企業搭建系統,後期每年收取20%的維護費。各家企業都在降低初裝費,意圖占據市場,靠後期維護費用收回成本。
巨頭環伺的市場,大資料初創公司突圍不易
在去ioe的趨勢下,中國大型企業都在面臨it裝置的更新換代,整個底層基礎平台市場潛力巨大。新興大資料公司利用其技術優勢和初創公司的高效決策機制,迅速搶占一些市場佔有率,占據一席之地不成問題。
這類公司主要服務金融、電信、交通、電力等領域的大型企業,這些領域原本是傳統內建商的地盤,是以新興大資料公司不可避免地将與內建商正面競争。華為、浪潮、亞信等公司之前主要是為大型企業提供硬體基礎設施,近年看到大資料領域的巨大潛力,紛紛成立了大資料部門,為客戶提供全套解決方案。
愛分析認為,未來幾年在底層基礎平台領域誕生一家估值10億美金的獨角獸公司是可以預見的,但是這些大資料公司中出現類似oracle這樣的巨頭公司可能性不大,基于以下幾點:
第一,産品同質化嚴重,市場競争激烈
底層基礎平台不同于上層應用,客戶需求類似,産品很難展現出差異化優勢。各家公司主要比拼産品性能的優劣,這種技術上的差異,新興公司最初會占據一定優勢,随着開源技術的普及,華為等公司會逐漸趕上,技術的差距會逐漸縮小。
這個市場并非全新市場,華為、浪潮、亞信等公司在這領域盤桓多年,新興公司發展到一定程度,勢必會侵入內建商的地盤。最近這段時間,星環科技和華為競争非常激烈,價格戰打得火熱。
第二, 技術疊代更新快,長期保持技術領先不易
hadoop誕生于2006年,spark于2009年出現,2013年hadoop已經釋出2.0穩定版本,兩種技術從誕生到成熟時間之短,令人震驚。在當今這個技術快速發展的時代,新興大資料公司一方面要應對市場競争,另一方面還要保持技術的領先地位,難度不小。
hadoop等分布式架構颠覆了傳統單機架構,很難說未來不會有新技術出現颠覆掉hadoop。一旦大資料公司賴以生存的根基遭到颠覆,謀求轉型勢必困難重重,公司大機率會失敗。不過目前apache hadoop社群運作良好,hadoop經過這些年的改善優化,性能和穩定性上獲得很大提升,spark等新技術大多都會對接在hadoop上面。未來幾年這方面風險較小,畢竟技術發展到現在,獨自造輪子的難度很大。
第三, 産品銷售能力遜于傳統巨頭公司
企業級市場,産品銷售能力将成為影響公司發展的重要因素。以oracle為例,早年與oracle競争的sybase和informix,其技術實力不遜于oracle,informix的技術甚至領先于oracle。這兩家公司最後在競争中出局,落得被收購的下場,主要是輸在市場推廣上,市場推廣的失利直接影響到公司的技術革新,最後導緻衰落。
在這方面,華為等傳統巨頭公司占據絕對優勢,一方面他們與客戶有長期合作關系,另一方面銷售團隊長期服務大型企業,經驗豐富。
那麼,什麼樣的公司有機會突圍成功,成為中國的oracle,愛分析認為具備以下幾點的公司機會最大。
第一,開源心态有助于保持技術領先地位
以hadoop為代表的開源技術正在改變世界,但開源和可持續盈利模式總是存在着一些沖突,近期rethinkdb公司的倒閉值得警惕,國内專注hadoop技術的公司效仿國外找到了一條盈利模式,但目前仍然存在一些風險。
公司要不要保持開源的心态,開放自己的技術給更多人使用?對大資料公司而言,技術是核心競争力之一,特别是對于這些做基礎平台的公司,開放技術無疑是削弱自身競争優勢,降低産品的附加值,減少公司的毛利,短期來看,開放技術會對公司的營收造成不良影響。
但是,從公司長遠發展來看,完全閉源會增大公司風險,其嚴重後果遠遠大于開放技術的影響。大資料公司最擔心的是路線圖出現偏差,自身技術與時代發展相左,喪失技術上的優勢。一旦發生公司的技術發展方向背離整個行業發展方向,需要停止已研發的項目,掉頭追趕行業腳步,這對創業公司來說是非常緻命的。
如果向開源社群開放自己技術,讓更多人了解、研究,有助于自身技術的發展,保證路線圖的正确性。同時,不斷向開源社群做出貢獻,還能提升公司在社群的話語權,進而提升公司在行業的影響力。這也是為什麼cloudera和hortonworks願意開放技術,争奪在hadoop社群的話語權。影響了開源社群,就會影響到整個行業技術發展程序,可以讓公司的發展始終保持在正确的軌道中。
第二, 商業拓展與技術研發同等重要
企業服務市場是銷售驅動型市場,而非技術驅動型,大資料這個細分領域同樣如此。技術實力再強,産品功能再多樣,也需要有客戶買單才行。有些創業公司隻重視研發上的投入,輕視市場推廣,公司每年訂單少,營收自然不高,團隊規模上不去,融資困難,公司發展緩慢。
單純技術上的優勢,在企業級市場并不是絕對影響因素。很多公司在poc階段都曾遇到過技術标第一,卻因為商業談判階段不理想而錯失訂單的事情。特别是現在市場處于跑馬圈地階段,搶占位置比什麼都重要,更是需要大力進行商業拓展。一旦市場格局穩定下來,到時候再切入市場難度很大。
另一方面,即使是基礎平台技術,也需要在實際應用中進行改進優化,各行各業中應用同樣的技術還是有一些差異,在應用過程中才會真正了解企業的痛點,更好地服務企業。在做項目過程中,大資料公司可以積累經驗,将這些經驗内化成産品的一部分,做出更适合中國企業使用者的基礎平台産品,築起公司的壁壘。
第三, 效仿oracle,建立适合公司的小生态
建立生态這一點并不是适合初創公司,是公司發展到一定程度後需要考慮的。擴大自己合作夥伴的隊伍,與其他公司共同開發産品,讓其他公司承擔一定銷售任務,有些時候要比單打獨鬥更适合企業級市場。
oracle這樣的巨頭公司,剛進入中國市場時也遇到不小的阻力。當時采取的做法是與中國本土公司合作,建立圍繞oracle的小生态,借助本土公司的力量敲開中國市場的大門。
做底層基礎平台的公司,作為連接配接硬體和應用的中間層,更需要與其他公司合作。平台上對接的應用越多,越有助于平台産品的推廣,開辟新的市場。
本文作者:佚名
來源:51cto