天天看點

CIO 指南:如何在 SAP® 軟體架構中使用 Hadoop

Gartner指出,2013年,大資料是影響資訊架構的最重要的技術趨勢之一。“資訊的數量、生成速度和種類都在不斷增加,而且那些未被治理和未得到充分利用的資訊中蘊藏着巨大的價值,同時也隐藏着潛在的風險。在這些因素的驅動下,資訊管理技術與實踐領域的重大創新層出不窮。”

SAPHANA能夠幫助企業解決一個非常重要的大資料問題,那就是快速通路和實時分析極其龐大的資料集。這樣,企業的管理人員和高管就能以思維般的速度了解自身的業務狀況,充分挖掘資訊的價值。另外,SAP還釋出了SAPReal-TimeDataPlatform(SAPData-baseandDataManagement的前身)。該平台整合了SAPHANA和SAPIQ,以及其他SAP技術和非SAP技術,特别是Hadoop,其中Hadoop就是本文探讨的對象。SAPReal-TimeDataPlat-form可以用于分析處理和聯機事務處理(OLTP)。盡管單獨使用時,每項技術也能傳遞業務價值,但若結合使用,這些技術就能整合、分析和處理企業擁有的所有資料,進而提供更深入的業務洞察,并創造新的業務機會。

為了在衆多資料技術中找到最佳的平衡點,解決業務問題,企業必須考慮諸多因素。除了軟硬體成本外,企業還必須考慮開發工具、與滿足其服務水準相關的營運成本,以及如何落實有關安全性、高可用性、安全備份和資料恢複的各項政策。

這就提出了兩個問題,同時也是本文要回答的兩個問題:

•在什麼情況下,Hadoop是解決業務問題的最佳方案?

•如何将Hadoop與SAP的解決方案及技術結合使用?

這些技術之間存在着許多重大差異。一方面,Hadoop采用商用伺服器處理PB級甚至EB級資料,這遠遠超過了SAPHANA和傳統關系資料庫管理系統(RDBMS)的處理能力,後者處理的資料規模通常為100TB級或更低。3另一方面,目前Hadoop版本的速度明顯比傳統的RDBMS和SAPHANA要慢,需要花費數分鐘或數小時才能提供分析結果。但是,這些版本能更輕松地處理任意資料結構,而且每TB資料的硬體存儲成本通常更低。

這就意味着,Hadoop與SAPHANA不同,它無法支援你以思維般的速度了解業務狀況。但是,Hadoop能幫助你以更低的成本存儲和通路更多更詳細的資料,進而以不同的方式更深入地了解企業的基礎資料。

最終,通過将SAPHANA與Hadoop相結合,你能夠快速處理真正的大資料。

繼續閱讀