天天看點

大資料分析與雲技術結合

大資料的出現使業務智能真正地走入了21世紀。但事實上“大資料”詞代表的并不是解決方案,而是一類問題。在這些PB數量級的資料中,隐藏着怎樣的價值?我們從中能得什麼,并且使之指導業務部署的方方面面。但這一巨大量資料實際上有用的沒有多少。是以為了利用其隐藏的價值,企業需要收集、過濾,并通過情感分析應用、定位工具以及其它的技術來分析它,從中産生有用的資訊,進而為今後的業務發展服務。

雲可作為大資料分析的使能器

Forrester定義大資料為“在大規模的經濟性下,擷取資料的技術和技能。”這裡最關鍵的一個詞是經濟。如果提取、處理和利用資料的成本超過了資料價值本身,那麼這項工作就是沒意義的。幸運的是随着資料量的不斷增長,技術也在不斷地進化,可幫助大部分企業利用這些資料。雲技術,無論是公有雲、私有雲還是混合雲,在讓企業從大資料分析中提取潛在的ROI方面,都是不可或缺的一部分。

收集并過慮

前面已經提到巨大量的資料中可用的部分很少,但還是有大量的資料需要過慮,以後關聯并存儲其有用性。對大量存儲着臨時資訊的基礎設施投資的利益幾乎沒有,因為這一臨時資料大部分都會被丢棄。另外從公司防火牆外部移到内部的網絡的資料也不會獲得什麼有價值的資訊,而且處理它也是使用IT經理頭疼的一件事。

這一階段的大資料過濾是一個完美的公有雲平台應用,它可以提供按需擴充的計算和存儲資源。

分析

一旦資料轉化為可用的形式,那麼就進入到分析産生資訊的階段。從長遠來看,提供給分析應用的原始資料沒有必要一下保留,需要有效存儲是分析處理的結果。公有雲和混合雲技術可用在分析階段,在資料集處理階段可引入Hadoop或類似替代方案。在公有雲使用者的情況下,原始分析階段可以在公有雲基礎設施上執行,然後使用私有雲元件把處理過的、可用的資訊拿到公司内部。

虛拟化、內建和協作

在這一階段,我們實際上已經擁有了可用的資訊,可以用來指導決策。這還沒有結束,還要使這些資訊可為使用者使用,轉化并住處到現有的系統中,如企業資源規劃和客戶資源管理應用。軟體即服務應用運作在雲中,利用稍早階段開發的資料,來強化內建,讓使用者互相協作。

有了雲計算技術,大資料的價值才能得到更好的轉化。不得不說,對于在使資料轉化為商用方面,雲是一個相當完美的平台。