天天看點

CIO指南:如何使用 SAP HANA® 平台處理大資料

文檔提要:

大資料通常包含三大屬性:數量、速度和種類。這些屬性給傳統的基于磁盤的關系型資料庫帶來了巨大挑戰。不同類型的資料對存儲功能和性能有着不同的要求,對應的成本也不同。SAP HANA平台提供了多種資料存儲器和處理引擎。現在,聯機事務處理 (OLTP) 和聯機分析處理 (OLAP) 應用可以基于單一系統、單個資料庫輕松運作。SAP HANA 中記憶體存儲器适用于必須高速通路和處理的高價值資料(熱資料)、經常更改的資料,以及需要 SAP HANA 平台原生功能的場景。而且,客戶通常用記憶體存儲器來處理 TB 級規模的(壓縮)資料。1動态分層選項基于 SAP IQ 軟體技術,利用基于磁盤的列式表擴充了 SAP HANA 資料庫。當企業需要較高的 OLAP 性能并與 SAP HANA 深度內建,或者當結構化查詢語言 (SQL) 的處理功能足夠滿足性能需求時,我們推薦企業采用該選項,存儲大型結構化資料集。例如,動态分層選項可以用于處理價值較低的資料(暖資料),因為這類資料對記憶體性能沒有要求。該選項可以管理從數百 TB 到數 PB 的資料量。Hadoop 适合能夠無限增長的原始資料、非結構化資料與半結構化資料,以及需要大規模橫向擴充的資料處理場景。借助 Hadoop,你能夠以較低的初始成本,實作靈活的橫向擴充。此外,Hadoop 還适用于來自業務應用且不再需要的資料(冷資料)。若要在 Hadoop 中對結構化資料進行高性能分析,我們推薦使用 SAP HANA Vora™ 引擎。這款 SQL 引擎支援使用者從 Hadoop 或 Spark,對 SAP HANA 中的資料通路進行優化。對所有資料而言,SAP HANA 是資料存取、資料模組化和系統管理的中心點。得益于其開放性特點,SAP HANA 平台可以利用非 SAP 技術按需進行擴充。這種靈活性讓該平台成為了一項可持續性投資。通過簡化系統管理和軟體生命周期管理,SAP HANA 助力 CIO 簡化系統架構,大幅降低擁有成本。