天天看點

流資料平台的5個核心屬性

流資料平台的5個核心屬性

  流資料平台的內建、流資料的采集以及流媒體應用的分析,有五個核心屬性是必不可少的。

  低延遲:流資料平台需要從流中獲得資料,并比對合适的資料源。流媒體資料平台的關鍵之一就是要有和特定的商業模式或場景比對的資料采集和近實時分析的能力。當你需要等待資料落到資料倉庫或基于Hadoop的資料湖時,那麼流分析的實時性價值就會被降低。尤其是在一些基于位置的應用或者是預測性維護的應用程式中,一旦在資料建立或落地的過程中花費太多的時間,那麼就可能會對企業業務有很大的影響,比如錯失重要客戶,甚至會造成極大的經濟損失。

  多樣化:流資料平台不僅僅要支援移動裝置、雲端,物聯網等等這些“新時代”的資料源,也要支援關系資料庫、資料倉庫和ERP、CRM、SCM等業務應用的“曆史遺留”的資料源。流資料平台必須與流裝置的資訊相結合才能夠提高資料洞察的準确性。

  集中性:一個核心租戶的流資料平台的架構是很容易實作的。采用集中式架構的流資料平台,不僅可以簡化流資料的來源和輸出之間的連接配接,而且可以提供統一的技術和業務中繼資料存儲庫,将資料轉換為通用的資料格式。

  持久性:資料是否能夠成功落到資料倉庫或基于Hadoop的資料湖中,是考察流資料平台的關鍵因素。這裡指的不僅僅是流資料的采集和分析,還包括曆史資料的處理分析,包括基于模式的政策規則、基于流資料分析處理的聚類分析。

  以上五個核心屬性是建立流資料平台的基礎,資料驅動型企業要想有長足的發展,那麼一個功能完整、架構強大的流資料平台是必不可少的。

作者:田曉旭

來源:IT168

原文連結:流資料平台的5個核心屬性