天天看點

阿裡雲 MaxCompute 2020-10 月刊

【10月新功能釋出】

1、MaxCompute 支援 sort by 不帶 distribute by

MaxCompute 支援 sort by 不帶 distribute by,提供資料重排的解決方案,提高SQL執行的過濾性能。

适用客戶

開發者

釋出功能

MaxCompute 支援不帶 distribute by 的sort by,提供資料重排的解決方案,提高謂詞下推的過濾性能。當 sort by 語句前沒有 distribute by 時能夠增加

存儲壓縮率,同時讀取的時候如果有過濾,能夠利用這個資訊減少真正從磁盤讀取的資料量,提高後面進行的全局排序的效率。

檢視文檔 >>

2、SEMI JOIN 支援 MAPJOIN Hint

SEMI JOIN支援MAPJOIN Hint,提高 LEFT SEMI/ANTI JOIN的性能,為資料傾斜問題提供解決方案。

開發者,分析師

當一個大表和一個或多個小表JOIN時,使用者可以在SELECT語句中顯式指定MAPJOIN Hint以提升查詢性能。目前MAPJOIN Hint進一步支援 LEFT SEMI JOIN和LEFT ANTI JOIN, 可以提高SEMI JOIN的性能,同時也為資料傾斜問題提供解決方案。

3、OSS外部表CSV/TSV檔案支援GBK編碼格式

OSS外部表CSV/TSV檔案支援GBK編碼格式。

OSS 外部表 odps.text.option.encoding 原先支援三種格式:UTF-8/UTF-16/US-ASCII,在新版本中增加了對GBK編碼格式的支援。

4、批量 Drop Partition 支援條件篩選

使用條件表達式比對選中的分區進行批量删除,滿足使用者希望一次删除符合某個規則的一個或多個分區的需求。

開發者、資料倉庫管理者

支援條件篩選方式删除分區。如果使用者希望一次性删除符合某個規則條件的一個或多個分區,可以使條件表達式比對選中的分區進行批量删除。

5、MaxCompute 新增支援更多内置函數

新增 WIDTH_BUCKET 函數,時間函數 year/quarter/month 等對 DateTime 輸入資料類型的支援。

開發者、資料分析師

WIDTH_BUCKET函數:擷取某個字段值落入的分組編号,設定分組範圍的最小值和最大值,以及分組個數,建構指定個數的大小相同的分組,傳回字段值落

入的分組編号。

時間函數 year/quarter/month/day/hour/minute/second 增加對DateTime輸入資料類型的支援 - 增加如下内建函數接口:

• INT year(datetime date)

• INT quarter(datetime date)

• INT month(datetime date)

• INT day(datetime date)

• INT hour(datetime date)

• INT minute(datetime date)

• INT second(datetime date)

6、MaxCompute 寫表支援Zorder by語句

增加 SQL DML的 zorder by 語句,支援把資料相近的行排列在一起,提升查詢時的過濾性能,一定程度上降低存儲成本。

增加 SQL DML 的 zorder by 語句,支援DML語句的方式把資料相近的行排列在一起,提升查詢時的過濾性能,一定程度上降低存儲成本。

閱讀往期月刊 >> MaxCompute 産品官網 >> 免費下載下傳《SaaS模式雲資料倉庫手冊》>>

更多關于大資料計算産品技術交流,可掃碼加入 “MaxCompute開發者社群” 釘釘群

阿裡雲 MaxCompute 2020-10 月刊