天天看點

關于資料分析軟體市場,這八大苗頭才是真正的大勢所趨!

緊張精彩的2015年已經結束了,現在是時候回過頭來看一看資料分析軟體市場的潮流。 已經有幾個趨勢繼續變得壯大(比如開源,雲托管,基于hadoop的sql解決方案),同時aws上的redshift開始成為資料倉庫中的一支重要力量。

sql解決方案繼續在hadoop的生态系統裡大行其道

除了spark,大部分hadoop的生态系統裡的新聞都來自presto, impala and drill。 關于mapreduce繼任者的鬥争還在持續,而在清單中的所有候選者的一個主要的共同點就是他們都提供sql界面。這個趨勢從2010年hive開始逐漸取代pig就一直如此。

因為太多的hadoop生态系統提供的價值圍繞在分析和商業智能上,而過去數十年整個分析世界已經運作在sql的基礎之上,并且圍繞它建立了很多無法替代的公司競争力,是以在經過了很多關于nosql和hadoop的憧憬以後,大家發現還是要回過頭來面對這個事實。

druid看起來要火

在主流的大規模基于記憶體的olap資料庫中,linkedin的pinot和metamarkets的druid是兩個主流選擇。 druid似乎從yahoo得到了不少關注,而且不少最前沿的高科技公司也開始越來越多地使用它來驅動實時商業智能(bi)。

十月份,druid一些主要貢獻者宣布了imply.io,一家為druid提供商業支援及打造出圍繞druid的生态系統的公司。總體而言,很多聰明人開始用druid來做記憶體資料庫,以便對海量資料集進行互動式分析。

開源機器學習庫galore

十一月, 谷歌開源tensor flow ,一個利用資料流圖譜進行計算的廣義庫。 它被大量用于機器學習,特别是深度神經網絡。 它還在加盟了十一月微軟釋出的theano,torch,dmlt。

雖然上面提到的這些庫不是可以把人工智能添加到任何産品的簡單插件,但是以他們為基石任何有足夠多的資料的人都可以來訓練他們的系統來制造最先進的算法。 當大家都開始在基石上建造,産品的整體複雜性,無論是分析相關還是其他方面,都會不斷提高。

ibm在spark上發力

6月,ibm 宣布把3500研發人員放在spark相關項目上。 spark是在許多方面是hadoop的生态系統裡的mapreduce的繼承人。 它為開發人員提供了四大法寶(低級别資料處理語言,機器學習庫,圖形算法和sql-on-hadoop資料庫)來進行資料的混合及比對。

雖然仍然在使用者實踐的最初階段,spark已經得到了背後龐大的開發者的支援。十月份,ibm宣布了基于bluemix的spark-as-a-service ,并且把其資料工程産品移植到spark上。這件事情對以開發apache spark為主業的databricks 公司的影響十分值得關注。

商業智能開源軟體開始興起的一年

從曆史上看,開源軟體的創新基本上在軟體堆棧的較底層。 随着時間的推移,以及對開源軟體企業可行的商業模式的的發展,越來越多的面向最終使用者的軟體正在以開源的方式進行開放。

去年,兩個古董的開源bi公司之一的jaspersoft被tibco以$ 1.85億美元收購。另一個公司,pentaho,則在前年2月就被日立資料系統公司以超過$ 5億美元收購。

同時,在2015年還湧現出了多家輕量級的開源項目。airpal和re:dash把重點放在使使用者能夠快速,輕松地在redshift上進行sql查詢(詳見下文),而metabase還提供了一個非常易于安裝的工具,允許非技術使用者對多種資料庫進行資料查詢和分享資料報表。

專有事件分析公司繼續湧現

雖然google analytics仍然是大家預設的首選,仍然有很多人緻力于開發以收集并分析在網站和移動應用上的使用者行為為中心的,集所有功能于一身的分析系統。

與此同時,作為google analytics的主要競争對手,mixpanel(截止去年已募集$ 6.5億美金),于去年7月跟随heap公司的腳步,釋出了codeless analytics。它主要是通過添加sdk到您的移動應用裡,自動對移動應用進行資料埋點,并同時獲得對使用者行為事件的分析,而無需手動對特定事件進行埋點。 十一月,該公司釋出了predict,它可以讓你使用輕量級的機器學習來預測使用者是否會執行一個動作(如轉換付費)。

與此同時 - heap已經因為它在移動和網絡事件的資料分析上的簡單易用性而獲得了一定的知名度; amplitude在八月融資$ 9百萬美元;而以增快資料分析速度為核心業務的interana也在一月份a系列融資$ 2000萬美元。

同時,廉價和簡單地運作一個資料倉庫的方案的出現(如aws的redshift)也對傳統的使用專有事件分析軟體的理念帶來了沖擊。

正在興起的建立于雲端的分析架構

在2015年,一個用于處理商業智能的新的标準正在越來越多的創業公司(以及願意保持創業心态的中型公司)中形成: 上世紀90年代的統一資料倉庫的概念正在回歸。允許這樣做的關鍵因素是aws redshit作為分析資料倉庫的廣泛采用。

因為redshitshift相對于老一輩的資料庫(如aster,vertica, teradata等)比較容易維護,它很快成為科技創業公司裡資料倉庫的首選。

有兩組初創企業乘着這股浪潮:那些幫助把你的資料轉移到redshift上的和那些讓你對在redshift上的資料進行分析的。

第一組包括一些公司講業務完全圍繞在将資料加載到redshift(如alooma,etleap,textur)。此外, segment去年正式宣布了将資料送到redshift上的能力。 同時,rjmetrics,一個電子商務分析的供應商,推出了他們的系統裡關于資料攝取的部分幫助您将資料送到redshift。

總而言之,許多公司都把自己的賭注押在aws上,絕大部分在去年秋天quicksight釋出前。随着aws的資料管道等攝入服務不斷完善,他們的業務模式是否仍然存在還有待觀察。鑒于aws的移動分析sdk和資料攝入管道的存在,可能留給這些公司的生存空間會逐漸消失。

鑒于quicksight的預覽版目前隻能提供很基本的功能,一些bi軟體供應商在2015年從在redshift上投入巨資的客戶上獲得了很多業務。 looker, mode analytics, periscope and metabase是在redshift被用來做分析資料的産品裡比較突出的。 然而,這個領域會怎樣發展很大程度上要看aws來年會帶來怎樣的新産品。

總而言之,2016年正在成為一個非常值得紀念的一年,尤其在融資放緩的影響更加明顯的情況下。

偉大的回火(公司估值壓縮)

雖然在事件形成的過程中很難感覺到,但回過頭來看,股票市場裡股價對營收比的壓縮對私募市場的影響很明顯,特别是當fidelity公開将它手中一大批其後期投資降低估值的時候。

在做分析軟體的公司中,cloudera的估值變化不大,而dataminr的估值下降了35%。 在一般情況下,分析創業公司的擷取資本的成本,無論是早期或晚期,都變高了很多。雖然大量的風投公司扔在獲得新的資金,并有足夠的錢去投資,總的感覺是,對初創企業的估值已經緩慢開始下調。

今年會有一些動蕩,無論是在募資上,還有更重要的是,在很多分析公司的客戶群的相關預算上。由于大多數公司的客戶終身價值對客戶流失的敏感度,2016年看起來會是一個需要系好安全帶準備迎接大風浪的時間。

本文轉自d1net(轉載)

繼續閱讀