存儲之于大資料分析
目前市場上有兩種類型的大資料分析方式--同步的和異步的,兩種都有各自在存儲容量和特性上的要求。
近來大資料分析這個詞正逐漸成為IT界流行的一個術語,以代指有關大資料本身的猜想,通俗說來即成堆資料背後問題的答案。然而,如果我們能夠從足夠的資料點入手比對及交叉分析,或許能幫助我們找到一些有用的資料,甚至可能幫助避免災難。
問題是顯而易見的,所有的分析都需要大量甚至海量的資料,這便給當今的IT管理人員帶來了更新的挑戰,即如何捕獲、存取、以及分析這些資料并将從中得到的分析用于後續任務的執行?

大資料分析應用通常會使用例如網絡流量、金融交易記錄以及敏感資料來替代傳統形式的内容。資料本身的價值在于資料間的比對、關聯或者引用。對大資料的分析通常會意味着與大量的小資料對象打交道,而這些小資料對象往往對響應延時要求非常之高。
目前業界主要有兩種大資料分析場景,而它們通常是根據資料處理的形式而區分:
在實時使用場景下,響應效率是最為關鍵的 ,是以大資料存儲架構本身的設計需要滿足最小延時的功能。
同步,即實時的或者近乎于實時的;另外一種就是異步的方式,這種方式下,資料首先會被擷取,記錄下來然後再用批處理程序進行分析。
同步分析
可以想到的近乎于實時的大資料分析的最早的例子就是超級市場裡的從業人員是如何統計消費者行為習慣以便于提供相應的優惠促銷券的。事實上是,消費者購買行為計算很可能在使用者收銀前就已經完成,但是概念本身是非常類似的。另外一個相關的例子是線上社交網站可以通過通路使用者的行為建立屬于他們的行為資料庫,這樣就可以根據各自不同的消費習慣提供不同的點對點廣告植入。
在零售行業,一些大型商鋪正開始在停車場對前來購物的消費者使用面部識别技術,這樣一旦他們路過或者經過對應的商鋪與之相應的促銷資訊便随之而來。是以,在這樣一類的實時大資料分析場景中,速度是第一要素,故而大資料存儲架構需要建設成為低延時的場景。
大資料分析逐漸在IT行業成為了一個熱門的話題,越來越多的企業相信它将引領企業走向成功。然而任何事情都有兩個方面。這件事情上來看,就是現有存儲技術本身。傳統存儲系統不管是在需要極低延時響應、實時大資料應用或者還是面對海量資料倉儲的資料挖掘應用的時候都會遇到瓶頸。為了保證大資料分析業務能正常運作,相應的存儲系統需要足夠快,可擴充并且成本效益有優勢。
完 謝謝觀看