DAX: SUMMARIZECOLUMNS 基本原理與用法

2023-04-16 07:16:23

本文講解DAX函數SUMMARIZECOLUMNS基本的原理與用法

前述

國内外關于DAX函數的講解已很多，但個别函數還是有必要拿出來再講講。本文結合MarcoRusso關于SUMMARIZECOLUMNS函數的理論以及自身對其的研究，專門講解該函數，并分為多個篇章。本篇将講解其基本原理與用法。

文法

首先是函數的文法：

SUMMARIZECOLUMNS( 
<groupBy_columnName> 
[, < groupBy_columnName >]…
, [<filterTable>]…[, <name>, <expression>]…
)

其參數定義如下表所示：

參數	必要	可重複	描述
groupBy_ColumnName	✓	✓	用于分組的列
filterTable	×	✓	提供篩選上下文的表或表表達式
name	×	✓	添加的新列名稱
expression	×	✓	新列的表達式

基本原理與用法

先講一個此函數的典型特征：SUMMARIZECOLUMNS隻有篩選上下文，沒有行上下文。比如對于如下資料模型：

DAX: SUMMARIZECOLUMNS 基本原理與用法

使用DAX建立表如下：

SUMMARIZECOL_NONMEASURE = 
SUMMARIZECOLUMNS (
    'DimProductCategory'[ProductCategoryName],
    'DimDate'[FiscalMonth]
)

它将根據這兩列，單純地CROSSJOIN成一個笛卡兒積表，也就是兩個字段值所有可能的組合，如下：

DAX: SUMMARIZECOLUMNS 基本原理與用法

這就是因為SUMMARIZECOLUMNS本身并未指定主表，兩個來自不同表的字段不能産生任何關聯，而函數引擎也無法為其生成對應的行上下文。

一旦在函數中引入可選參數filterTable，并指定主表，公式就可以傳回資料集中真實存在的非空組合，而非笛卡兒積, 這就是因為SUMMARIZECOLUMNS利用了’FactSales’的行上下文對結果集進行了篩選。

SUMMARIZECOL_NONMEASURE = 
SUMMARIZECOLUMNS (
    'DimProductCategory'[ProductCategoryName],
    'DimDate'[FiscalMonth],
    'FactSales'
)

如果引入路徑成本，SUMMARIZECOLUMNS也可以借用路徑成本所在表的行上下文對其産生的結果集進行篩選。此外，如果所有的路徑成本對某一行的計算結果為空，該行将會被排除。

此處，我們引入路徑成本。DAX建立表如下：

SUMMARIZECOL = 
SUMMARIZECOLUMNS (
    'DimProductCategory'[ProductCategoryName],
    'DimDate'[FiscalMonth],
    "SALES", SUM ( 'FactSales'[SalesQuantity] )
)

可得到：

DAX: SUMMARIZECOLUMNS 基本原理與用法

這裡公式傳回結果的原理為：SUMMARIZECOLUMNS借用了主表的行上下文，對SALES值進行求和計算，并使用[ProductCategoryName]以及[FiscalMonth]對結果進行GroupBy，并過濾SALES為空的行。

如果我們使用SUNMARIZE函數來模拟以上SUMMARIZECOLUMNS的計算，則公式為：

SUMMARIZECOL_SIMULATE = 
FILTER (
    SUMMARIZE (
        CROSSJOIN (
            VALUES ( 'DimProductCategory'[ProductCategoryName] ),
            VALUES ( 'DimDate'[FiscalMonth] )
        ),
        'DimProductCategory'[ProductCategoryName],
        'DimDate'[FiscalMonth],
        "SALES", CALCULATE ( SUM ( 'FactSales'[SalesQuantity] ) )
    ),
    NOT ISBLANK ( [SALES] )
)

該公式将傳回與上圖相同的結果。注意，此公式僅僅是為了便于讀者了解其原理，實際使用時，還是推薦你直接使用SUMMARIZECOLUMNS，因為前者執行了三個SE查詢，效率低于後者。

DAX: SUMMARIZECOLUMNS 基本原理與用法

有關SUMMARIZECOLUMNS相對于SUMMARIZE的性能優勢解析，可參見下篇部落格。

DAX: SUMMARIZECOLUMNS 基本原理與用法

前述

文法

基本原理與用法

繼續閱讀

CALCULATE函數的運算順序-第一彈

Power Platform: 一文讀懂CDS(含實操)

powei bi 報表項目m權限設定

如何在PowerBI中添加實時更新的時鐘？原來這麼簡單

在Power BI中根據使用者選擇動态生成帶過濾條件的報表URL (Dynamic URL Link)

PowerBI路徑成本動态格式字元串太好用了，輕松實作動态資料格式

月份篩選器控制時間軸往後或者往前滾動幾個月份

PowerBI 5月重大更新來了

BI技巧丨近兩年及當年月份資料彙總

BI-SQL丨ALL、ANY、SOME

Power BI中表和矩陣的差別

powerquery 連接配接 postgresql

Power BI 資料源及資料重新整理

PowerBI基礎——第二天最強大的引擎calculate、篩選表calculatetable、進階篩選器filter1、關系函數2、進階篩選器filter

學習PowerBI書籍推薦第一本DAX權威指南推薦指數⭐⭐⭐⭐⭐推薦理由：了解DAX背後原理，高效寫DAX。第二本DAX

PowerBI可視化實戰：商品銷售動态ABC分析案例