天天看點

大型企業大資料創新的五大重要趨勢

大型企業大資料創新的五大重要趨勢

“大資料”已經不僅僅是一個時髦用語,利用大資料分析正在成為越來越現實的問題,甚至ibm都已經宣布投入10億美金發展powerlinux系統以支援其大資料戰略。

從企業規模來看,利用大資料更有優勢的是大型企業。根據研究機構forrester research對大量大型企業的調查資料顯示,平均每家企業産生的資料總量約為非結構化資料50tb、半結構化資料2tb、結構化資料12tb。

但forrester research首席分析師bryan wang同時指出,大型企業大資料綜合使用率僅為12%左右,“企業花了大量的金錢在存儲上”——而不是分析。

目前使用大資料技術的企業占比約為20%,另有37%企業正在籌劃大資料項目,希望通過大資料分析的威力獲得更高的企業洞察。那麼,大資料在大型企業重要項目應當如何應用呢?這裡是大型企業大資料創新的五大方向。

1 ) 混合資料雲。混合資料雲是一個值得強調的話題,因為大型企業不可能放棄現有的結構化的資料基礎設施。從oracle,ibm和微軟的系統的結構化資料正在支撐大多數大公司的運作。資料基礎設施技術執行的目标是将這些現有的系統融入混合系統,同時吸收非結構化的資料和外部資料。

然而,傳統的廠商要做到這一點可能不太容易。雖然現有的系統将保持,但那些傳統廠商的技術可能局限在現有的項目,而企業新的投資更可能流向新的供應商和新的平台。

stubhub公司有25種結構化和非結構化資料源的資料網絡。stubhub首席資料架構師sastry malladi表示,使用開源産品對于避免專有架構的鎖定非常重要。“眼下最重要的創新,是如何建立一個混合的資料系統,”malladi說。

2 ) 移動性推動大資料投資。移動平台和它們的位置、通信和便攜性提出了一種客戶平台客戶定制的大資料創新。線上健康網站mapmy fitness開始記錄使用者的運作路線,并已經擴充到各種各樣的健身活動,以及個人健康監測。

mapmy fitness副總裁matt mclure已經看到公司增長到19萬使用者,并開發出一種混合私有雲和公共雲的基礎設施,以支援使用者的行為,如新增的夏季騎自行車的人和健身愛好者。“我們是在健康和關連健身生态系統的中心。”mclure說。額外的健康和健身監控相關的擴充要求,驅動該公司使用像 facebook和谷歌等開發的資料技術。

3 ) 大資料可以圍繞和增強現有的應用程式。stubhub開始隻作為一個體育和娛樂項目的票券交易平台。但該公司目前正在采取一個更廣泛的角度,一個項目周圍的所有活動,包括社會評論,住宿,餐飲和交通服務。這些社交網絡服務驅動捕獲、分析大量的資料的混合模型,并驅動推薦引擎。傳統的交易系統的設計根本就沒有考慮這種類型的使用者輸入。

4 ) 物聯網将讓目前的大資料項目看起來像小東西(small stuff)。美國商業智能廠商sas進階主管paul bachteal指出,當你開始考慮将所有的資料引入組織,将物聯網從概念變成現實,建構采集,存儲,分析和建立預測分析的系統,需要的技能是供不應求的,客戶和供應商将不得不展開員工技能的教育訓練工作。

bachteal以鐵路機車為例,表示一旦配備傳感器并連接配接到一個資料分析系統,客戶将能夠更準确地預測部件的磨損,進而可以防止裝置故障。

5 ) 大創新來到資料頻譜的前端。沃爾瑪正在考慮使用crowd sourcing(衆包)來設定産品價格和選擇産品說明配圖。沃爾瑪實驗室進階工程總監digvijay lamba表示,在決策過程的前端使用技術如crowd sourcing,完成大資料的頻譜。

現有的大資料系統擅長于分析巨大的資料池,但隻有在資料進入該系統的時候。crowd sourcing代表了一種方式,把額外的資料添加到大資料流程的前端,利于提高分析結果。lamba說:“我們需要擴充系統的前端。”

大資料已經不僅僅是一個流行的詞彙,但建立大資料系統需要思考決策系統的新途徑,這現在剛剛進入市場。

<b>原文釋出時間為:2013-10-10</b>

<b></b>

<b>本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号</b>

繼續閱讀