通過使用cache緩存機制,減少資料分析處理過程中直讀OSS的次數,不僅能夠提高性能,更能減少與OSS的互動流量,減少資料分析成本與時間開銷。
前提條件
- 已注冊阿裡雲賬号,詳情請參見注冊雲賬号。
- 已開通E-MapReduce服務和OSS服務。
- 已完成雲賬号的授權,詳情請參見角色授權。
- 已建立Haoop叢集,且帶有Hive元件,且配置OSS資料源。
步驟一:設定JindoFs Cache
打開smartdata服務中client配置,
把jfs.cache.data-cache.enable為1, 表示打開JindoFs的cache功能打開
步驟二:進行作業測試
資料分析作業具體可看其他OSS資料湖實踐文檔功能
OSS Spark 實踐文檔 OSS Flink 實踐文檔 OSS Hive 實踐文檔