天天看點

大資料的四大次元深度解析

數量也許是與大資料最相關的特征,指企業為了改進企業中的決策而試圖利用的大量資料。資料量持續以前所未有的速度增加涵蓋這四個次元有助于定義和區分大資料:

數量:資料量。數量也許是與大資料最相關的特征,指企業為了改進企業中的決策而試圖利用的大量資料。資料量持續以前所未有的速度增加。然而,真正造成資料量”巨大”的原因在不同和行業和地區各有不同,而且沒有達到通常引用的pb級(petabyte)和zb級(zetabyte)。超過一半的受訪者認為資料量達到terabyte和petabyte之間才稱為大資料,而30%的受訪者不知道”大”對于其組織應該有多大。所有受訪者都同意,目前被認為”巨大的數量”在将來甚至會更大。

大資料的四大次元深度解析

多樣性:不同類型的資料和資料源。多樣性是指管理多種資料類型的複雜性,包括結構化、半結構化和非結構化資料。企業需要整合并分析來自複雜的傳統和非傳統資訊源的資料,包括企業内部和外部的資料。随着傳感器、智能裝置和社會協同技術的爆炸性增長,資料的類型無以計數,包括:文本、微網誌、傳感器資料、音頻、視訊、點選流、日志檔案等。

    速度:資料在運動中。資料建立、處理和分析的速度持續在加快。加速的原因是資料建立的實時性天性,以及需要将流資料結合到業務流程和決策過程中的要求。速度影響資料時延 – 從資料建立或擷取到資料可以通路的時間差。目前,資料以傳統系統不可能達到的速度在産生、擷取、存儲和分析。對于對時間敏感的流程,例如實時欺詐監測或多管道”即時”營銷,某些類型的資料必須實時地分析,以對業務産生價值。

    精确性:資料不确定性。精确性指與某些資料類型相關的可靠性。追求高資料品質是一項重要的大資料要求和挑戰,但是,即使最優秀的資料清理方法也無法消除某些資料固有的不可預測性,例如天氣、經濟或者客戶最終的購買決定。不确定性的确認和規劃的需求是大資料的一個次元,這是随着高管需要更好地了解圍繞他們身邊的不确定性而引入的次元(參考:”精确性,第四個’v'”)。

    最後,大資料是這些特征的組合,為企業在目前的數字化市場中創造競争優勢提供了機會。它使企業能夠轉變與客戶互動并滿足客戶需求的方式,并且使企業– 甚至整個行業 – 能夠實作自身的轉型。并非每家企業都采用相同的方法培養其大資料能力。但是,利用新的大資料技術和分析方法改進決策和績效的機會存在于每個行業中。

繼續閱讀