天天看點

企業擁抱大資料,Hadoop 和Spark漸受歡迎

雖然國内大資料相較國外起步較晚,但增長态勢卻一路上揚,完美诠釋了典型的“中國速度”,不僅是企業和政府使用者對于大資料的認知在提升,而且在搭建平台和提供資料服務方面,企業使用者也開始了更為深入的探索。

來自中國信通院的資料顯示:2016年中國大資料市場規模将達到16.8億元人民币,增速為45%,預計未來3年(2017~2020年),增速将穩步保持在30%以上。

市場風生水起,離不開政府層面的扶持。國家“十三五”規劃綱要明确表示:實施國家大資料戰略是“十三五”時期的重點。去年國家力挺大資料應用,批複了京津冀等7個國家級大資料綜合試驗區和超過10個大資料國家工程實驗室。

緊接着,今年1月國家印發的《大資料産業發展規劃(2016-2020年)》(以下簡稱《規劃》)無疑又為火熱的大資料又添了一把柴。按照《規劃》預計,在2020年,我國技術先進、應用繁榮、保障有力的大資料産業體系将基本形成,大資料相關産品和服務業務收入将突破1萬億元人民币。

實體産業的落地速度也是快馬加鞭,就在本月,坐落于廊坊的京津冀大資料創新應用中心主體工程竣工,并于5月18日正式投入營運。該中心包含體驗中心、研發中心、雙創中心、應用中心、感覺中心5大核心功能區,打造以大資料為核心的特色産業體系。

“利用大資料改造傳統動能、培育新動能,對實作創新驅動發展,意義重大、前景廣闊”,工業和資訊化部副部長陳肇雄表示,一方面引導地方結合自身條件,科學謀劃發展重點,在大資料産業特色優勢明顯的地區建設一批産業集聚區;另一方面,支援地方大資料應用試點,開展系統性探索試驗,形成有效經驗和模式,加快推廣普及。

政府資料開放“三不”寫成了難

雖然有國家政策保駕護航,但擺在産業界面前的難題也不少,想要真正實作商業化,形成良性的産業生态道阻且長。諸如在時下高度受關注的大資料共享和開放方面,産業界還未找到行之有效的方法。

中國工程院院士邬賀铨對此表示:缺乏公共平台、共享不通暢、開放總量偏低、結構化程度低,群眾參與回報不準等,這些都是擺在資料共享開放前面的最直接難題。

大資料的價值在于融合和挖掘,作為擁有最大資料源基礎的政府一方,本該在資料共享方面起到表率作用,促進資料的融合挖掘,但現實卻是政府資料開放呈現三個“不”字。

不敢于、不願意、不容易,這三個關鍵詞正好反映出目前政務雲建設過程中,政府對于資料開放共享的真實态度。

中國資訊通信研究院院長劉多表示,由于國家層面目前在資料安全方面還缺乏具有指導性的規定和細則,這就導緻政府在共享資料方面不敢于也不願意邁出大步;另一方面,政府it系統多為封閉的“煙囪式”it建構,即便想要資料共享,也需要接口的标準化和統一的頂層設計。

“開放共享對于政務透明、全社會信用體系建設和創新都非常重要,我們需要共同努力!”劉多如是說。

産業動起來,hadoop 和spark漸受歡迎

監管未細,但産業界早已行動。來自中國信通院一份國内1465 使用者的大資料問卷調查顯示:近六成企業已成立資料分析相關部門,27.3% 的企業計劃成立資料部門。更重要的是,絕大部分企業均已意識到資料分析對企業發展的重要性,在使用者看來,大資料能夠為企業帶來最直覺的效果就是:智能決策和提升營運效率。

更有趣的是,市場對于搭建大資料平台的方式也在發生微妙的變化,相較于前兩年直接購買內建一體機的方式,在2016年,傾向于本地自建大資料平台(48.6%)和采購雲服務商的大資料服務(33.1%)的比例占到了總體受訪者的80%。

這似乎已經傳遞出一個非常明确的趨勢:企業擁抱大資料,更青睐以開源平台來建構大資料,這也就解釋了業界為何如此看重hadoop 和spark這兩項大資料平台技術架構的原因。

不過開源之路并不像看上去那麼美好,除了自身具備一定的技術實力之外,如何融入從國外舶來的開源社群文化,兼顧資料服務的安全性、穩定性和可擴充性都将成為企業使用者即将面對的重要課題。

本文轉自d1net(轉載)

繼續閱讀