2月15日,阿裡雲大資料公司調研組來到高新區,進行為期三天的大資料産業發展情況調研活動。高新區分管上司、市工商聯副主席及職能部門參加了此次調研活動。
調研組一行首先走訪了大全集團和威騰集團。兩家企業就目前的業務現狀、大資料的運用、大資料與人工智能方面的相關設想,企業在雲計算與大資料這塊面臨的問題等方面進行深入探讨。
走訪大全集團
走訪威騰集團
阿裡雲創新中心五葉草大資料孵化器ceo王獻旗在考察了高新區區域規劃和主導産業後,向分管上司介紹了阿裡雲孵化大資料,不同于隻提供辦公場地傳統孵化器,阿裡雲則是創新型孵化器,提供的是流量、雲計算伺服器和釋出平台。就算在家裡也能創業。
考察高新區區域規劃
考察高新區主導産業
阿裡雲大資料平台--“數加”
長期以來,企業資料處理的終極結果往往就是商務智能,但一張所謂的智能報表由于無法實作實時計算,并不能真正代表企業的營運情況。其次,資料存儲的成本并不低,倘若無法從資料中挖掘出核心價值,那麼資料不但不會是企業發展的動能,還将成為企業的重要成本。第三,即便是hadoop平台出現之後,雖然擁有了開放、廉價、基于普通商業硬體的平台,但大資料應用的開發成本,無論是技術門檻還是價格都讓很多普通開發者望而卻步。
在這樣的産業發展背景之下,“數加”這樣一個分布式大資料開發平台的推出引人關注。
首先,作為“一個資料公司”(馬雲語),阿裡巴巴擁有着處理大資料的豐富經驗。單就雙十一來說,淘寶/天貓訂單的建立峰值能力突破了每秒鐘14萬筆,支付寶的支付峰值達到了每秒8.59萬筆,遠高于visa實驗室測試資料的每秒5.6萬筆以及mastercard實驗室測試資料的每秒4萬筆,這些資料處理經驗都将反映到“數加”的産品中。
其次,“數加”并非一款單獨的産品,而是一條完整的大資料開發鍊條。當天釋出的20款産品,覆寫了資料采集、計算引擎、資料加工、資料分析、機器學習、資料應用等資料生産全鍊條。
其中,由大資料計算服務(maxcompute)、分析型資料庫(analytic db)、流計算(streamcompute)共同組成的底層計算引擎,速度快且成本低。測算資料顯示,自建hadoop叢集的成本是“數加”的1.5倍,國外計算廠商aws 的emr成本更是“數加”的5倍。
另外,“數加”的雲端資料開發套件,包括資料內建、資料開發、排程系統、資料管理、運維視屏、資料品質、任務監控,能夠幫助開發者快速部署相關産品。則通過視化産品datav的資料分析,開發者可以一星期做出阿裡雙十一的資料監控大屏。同樣基于datav,“數加”還釋出了面向政府的行業應用産品“郡縣圖治”。通過這款産品,縣長可以在一個螢幕下統覽全縣各項經濟民生資料,為政府決策提供輔助。
“數加”推出的機器學習工具,可基于海量資料實作對使用者行為、行業走勢、天氣、交通等的預測。圖形化程式設計讓使用者無需編碼、隻需用滑鼠拖拽标準化元件即可完成開發。産品還內建了阿裡巴巴核心算法庫,包括特征工程、大規模機器學習、深度學習等。
而在應用層面,支撐阿裡巴巴客服系統的智能語言互動和文字識别ocr也即将上線。開發者可以利用這兩個應用開發更具人工智能的大資料産品,比如搭建智能化的客服體系,利用文字識别ocr快速推出掃描類的應用,保障使用者體驗,節約成本。
最後,在一個軟體即服務的時代,“數加”要做的也不僅僅是完整的資料開發工具,而是一項資料增值服務。大資料行業的進步不僅需要底層技術尤其是開發技術的發展,以降低技術門檻和資金門檻,還需要大量資料分析人才、資料科學家。
“
正如科幻小說家威廉·吉布森所言:未來已經到來,隻是分布還不均衡。我們已經看到整個社會都在轉向資料層面的運作。而當網際網路成為像水、電一樣的基礎設施時,産生于網際網路(包括但不限于桌面網際網路、移動網際網路、物聯網等)的資料也成為一種新型的生産資料,在雲計算的大背景下,分布式的資料分析計算平台将創造更多的創業機會,讓資料能夠互聯互通,資料驅動的創業變革也已在發生。
”
版權說明
文中圖文來源網絡,版權屬于原作者!