天天看點

PowerBI - 9.業務資料中心資料分析供給服務

作為資料供給服務,包括資料倉庫,多元資料集,開放式資料倉庫,流式資料等,按不同業務分析需要選擇适當的元件。按需指實時及準實時方式,而又有不同的重新整理頻率要求的标準,又因為不同系統有不同資料限制,接口限制,權限限制,是以又有不同的組合接出方式。

9.1. 多元分析服務介紹

SQL Server 2016 在分析服務中引入了統一的商業智能語義模型,以幫助企業建構全面的企業級的分析解決方案。SQL Server 2016分析服務具有靈活、功能豐富的特性,能夠适用于各類的業務環境,通過與其它工具與技術的搭配使用,可以為使用者提供細化的安全性、嚴謹的業務邏輯和流暢的使用體驗。

Analysis Services 是一個多元分析模組化工具和多元分析模型資料提供服務引擎。 使用進階糅合和模組化功能,可以在單個受信任的表格語義資料模型中合并多個資料源中的資料、定義名額以及保護資料。 該資料模型可讓使用者更快速輕松地浏覽大量資料進行即席資料分析。

 可為強大的聯機分析處理 (OLAP) 技術提供持續支援, 進而使 SQL Server 分析服務 成為商業智能專家不可或缺的 好幫手。

 可作為經常按行和列處理資料 的 IT 專業人員和開發人員的專 用工具。

 可跨越個人、團隊和企業環境 為一系列商業智能解決方案提 供支援。

 豐富多樣的模組化功能和成熟嚴謹的業務邏輯,利用分析服務豐富多樣的模組化功能簡化建構複雜解決方案的過程。采用适當的技術滿足各種不同類型的需求。

 細化安全方案,分析服務中基于角色的安全模型采用 Active Directory 和行級安全方案。

基本特性:

  1. 多元路徑成本查詢速度性能好,速度快
  2. 系統對比關系資料在有索引的情況下1億資料6次元,10列量值,關系型資料庫查詢為261秒,而多元分析服務隻需要約200毫秒(1秒不到),并且硬碟讀寫I/O,記憶體占用,CPU占用都是關系型庫的十分之一。
  3. 資料安全
  4. 支援按次元配置安全角色或使用者(需要域使用者或系統用),支援按多個或單個量值是否可以通路配置權限,支援按次元組合量值實作單元格級資料配置安全權限。

9.2. 分鐘級/小時級準實資料接出

9.2.1. 多元資料集快速高性能接出

對于小時以上的準實時資料最适合用多元資料集進行輸出,對比Hadoop具備使用存儲空間更少,使用記憶體和CPU性能更少的特點,并且可以使用記憶體和硬碟作為換算,綜合上來說是節省硬體資源提高反映速度的元件,缺點是由于多元分析資料初始化/增量初始化過程需要大量計算而導緻隻能選擇适合的業務資料和重新整理頻率要求的才能進行使用。

9.3. 秒級準實時資料接出

9.3.1. 記憶體表分析功能

使用SQL Server記憶體表進行快速通路,隻需要給表資料,并大多以結果表結構的,使用此方式可以快速靈活的提供變化的資料口徑,次元的組合,并達到秒級重新整理頻率。缺點是占用記憶體較多,而且記憶體表本身與實體表之間有限制,大部分時候結果方式供給。

9.4. 實時資料接出

9.4.1. 程式接口接入接出功能

使用程式接口對資料進行接入接出,一種是通過流式資料,以消息隊列(MessageQueue)方式進行對資料推送,即流式資料方式。第二種為記憶體表方式,以利用記憶體表影響的寫讀速度快優點,先把結果或接近結果的資料集存放再進行輸出的途徑。

9.5. 即時資料接出

9.5.1. 直連業務系統

此方式一般應用在業務系統需要實時業務報表并同時需要BI的下鑽等技術特點的報表。在大部分情況下不建議BI展示工具直連業務系統,原由由于BI作為分析,前提會對大量資料進行歸集合并輸出,在此種情況下,若直連報表業務系統可能導緻系統因大量讀或讀鎖而業務系統卡頓時間過長或奔潰情況。是以BI工具直連業務系統一般為了測試和特點的業務報告需要BI技術特點而用。

9.5.2. 流式資料接出

使用流式作為資料倉庫的一部分元件服務,流式資料主要針對1秒級,或1秒15次左右工業應用,隻能使用Kafka或cosmos或消息隊列等實時通信的流式計算資料架構。相對Hadoop前者更有速度和性能優勢。或可使用自定義開發流式資料接口,推送方式以得顯示。

若有什麼需要修正請聯系我: 林嘉誠, [email protected]

繼續閱讀