天天看點

OSS 資料湖實踐 —— 使用EMR JindoFs Cache提升性能前提條件步驟一:設定JindoFs Cache步驟二:進行作業測試

通過使用cache緩存機制,減少資料分析處理過程中直讀OSS的次數,不僅能夠提高性能,更能減少與OSS的互動流量,減少資料分析成本與時間開銷。

前提條件

  • 已注冊阿裡雲賬号,詳情請參見注冊雲賬号。
  • 已開通E-MapReduce服務和OSS服務。
  • 已完成雲賬号的授權,詳情請參見角色授權。
  • 已建立Haoop叢集,且帶有Hive元件,且配置OSS資料源。

步驟一:設定JindoFs Cache

打開smartdata服務中client配置,

把jfs.cache.data-cache.enable為1, 表示打開JindoFs的cache功能打開

步驟二:進行作業測試

資料分析作業具體可看其他OSS資料湖實踐文檔功能

OSS Spark 實踐文檔 OSS Flink 實踐文檔 OSS Hive 實踐文檔

繼續閱讀