【10月新功能釋出】
1、MaxCompute 支援 sort by 不帶 distribute by
MaxCompute 支援 sort by 不帶 distribute by,提供資料重排的解決方案,提高SQL執行的過濾性能。
适用客戶
開發者
釋出功能
MaxCompute 支援不帶 distribute by 的sort by,提供資料重排的解決方案,提高謂詞下推的過濾性能。當 sort by 語句前沒有 distribute by 時能夠增加
存儲壓縮率,同時讀取的時候如果有過濾,能夠利用這個資訊減少真正從磁盤讀取的資料量,提高後面進行的全局排序的效率。
檢視文檔 >>2、SEMI JOIN 支援 MAPJOIN Hint
SEMI JOIN支援MAPJOIN Hint,提高 LEFT SEMI/ANTI JOIN的性能,為資料傾斜問題提供解決方案。
開發者,分析師
當一個大表和一個或多個小表JOIN時,使用者可以在SELECT語句中顯式指定MAPJOIN Hint以提升查詢性能。目前MAPJOIN Hint進一步支援 LEFT SEMI JOIN和LEFT ANTI JOIN, 可以提高SEMI JOIN的性能,同時也為資料傾斜問題提供解決方案。
3、OSS外部表CSV/TSV檔案支援GBK編碼格式
OSS外部表CSV/TSV檔案支援GBK編碼格式。
OSS 外部表 odps.text.option.encoding 原先支援三種格式:UTF-8/UTF-16/US-ASCII,在新版本中增加了對GBK編碼格式的支援。
4、批量 Drop Partition 支援條件篩選
使用條件表達式比對選中的分區進行批量删除,滿足使用者希望一次删除符合某個規則的一個或多個分區的需求。
開發者、資料倉庫管理者
支援條件篩選方式删除分區。如果使用者希望一次性删除符合某個規則條件的一個或多個分區,可以使條件表達式比對選中的分區進行批量删除。
5、MaxCompute 新增支援更多内置函數
新增 WIDTH_BUCKET 函數,時間函數 year/quarter/month 等對 DateTime 輸入資料類型的支援。
開發者、資料分析師
WIDTH_BUCKET函數:擷取某個字段值落入的分組編号,設定分組範圍的最小值和最大值,以及分組個數,建構指定個數的大小相同的分組,傳回字段值落
入的分組編号。
時間函數 year/quarter/month/day/hour/minute/second 增加對DateTime輸入資料類型的支援 - 增加如下内建函數接口:
• INT year(datetime date)
• INT quarter(datetime date)
• INT month(datetime date)
• INT day(datetime date)
• INT hour(datetime date)
• INT minute(datetime date)
• INT second(datetime date)
6、MaxCompute 寫表支援Zorder by語句
增加 SQL DML的 zorder by 語句,支援把資料相近的行排列在一起,提升查詢時的過濾性能,一定程度上降低存儲成本。
增加 SQL DML 的 zorder by 語句,支援DML語句的方式把資料相近的行排列在一起,提升查詢時的過濾性能,一定程度上降低存儲成本。
閱讀往期月刊 >> MaxCompute 産品官網 >> 免費下載下傳《SaaS模式雲資料倉庫手冊》>>更多關于大資料計算産品技術交流,可掃碼加入 “MaxCompute開發者社群” 釘釘群
