天天看點

獨家 | 手把手教資料可視化工具Tableau

獨家 | 手把手教資料可視化工具Tableau

前言

資料的世界正在發生急劇變化,任何人都應該通路自己需要的資料,并具備擷取任何資料的洞察力,而tableau正是幫我們洞察資料的好幫手。

Tableau作為BI tool leader ( 2016 Gartner BI chart), 它不僅是一款可視化軟體,還具備不可忽略的強大的Data connection, collaboration, security management, multi-platform功能性:

Data connection:Tableau Desktop可直接連接配接Salesforce(銷售報表),各類常用資料庫(sql, aws, hadoop, SAP HANA), Google analytics ( 流量分析),最新的版本10支援連接配接json檔案

Data refreshment:實作全部報表定時自動從中繼資料更新

Data preparation and data processing:在2016年的Tableau大會上, Tableau宣布即将推出一款自動化data preparation的産品,并展示了收購Hyper後可以做到幾秒内ingest百萬級的資料

Security management:很輕易地添加user, 設定user group,且可通過tabcmd在terminal中自動完成使用者管理

Multi-platform:在網頁,手機,tablet間實作跨平台的可視化

我認為學習Tableau最主要的一點是要了解它的用法特點,尤其是和Excel的不同之處。從我在學習和制作Tableau報表的時候得出了一定的經驗,學習者一定要謹記以下四點:

可視化(誰都知道Tableau是可視化專家,但你真的知道怎麼用可視化嗎?)

聚焦/深挖 (上可看整個公司面貌,下可聚焦到單個産品/顧客)

靈活分析

互動化圖表(我認為Tableau最強的地方)

Tableau工作區

Tableau 工作區包含菜單、工具欄、“資料”窗格、卡和功能區以及一個或多個工作表,表可以是工作表、儀表闆或故事。

工作表包含功能區和卡,您可以向其中拖入資料字段來建構視圖。

獨家 | 手把手教資料可視化工具Tableau

A. 工作簿名稱。

B. 卡和功能區 - 将字段拖到工作區中的卡和功能區,以将資料添加到您的視圖中。

C. 工具欄 - 使用工具欄通路指令以及分析和導航工具。

D. 視圖 - 這是您在其中建立資料可視化的工作區。

E. 轉到開始頁面。

F. 側欄。側欄提供兩個窗格:“資料”窗格和“分析”窗格。

G. 轉到資料源頁面。

H. 狀态欄 - 顯示有關目前視圖的資訊。

I. 工作表标簽 - 标簽表示工作簿中的每個工作表,這可能包括工作表、儀表闆和故事。

Tableau概念

為何有一些字段次元和其他度量?添加篩選器将對我的視圖産生什麼影響?為何一些字段的背景顔色是藍色,而另外一些字段的背景顔色是綠色?

本節中的主題将嘗試闡明這些問題,以及有關您在使用 Tableau Desktop 可以看到和體驗到的功能的其他問題。

資料類型

資料源中的所有字段都具有一種資料類型。資料類型反映了該字段中存儲的資訊的種類,例如整數 (410)、日期 (1/23/2015) 和字元串(“Wisconsin”)。字段的資料類型在“資料”窗格中由以下所示的圖示之一來辨別。

1. Tableau 中的資料類型圖示

獨家 | 手把手教資料可視化工具Tableau

您可以在“資料源”頁面上或“資料”窗格中更改字段的資料類型。

2. 在“資料源”頁面中更改字段的資料類型

有時,Tableau 會不正确地解釋字段的資料類型。例如,Tableau 可能會将包含日期的字段解釋為整數資料類型,而不是日期資料類型。

此時您可以在“資料源”頁面上更改曾經作為原始資料源一部分的字段(而不是在 Tableau 中建立的計算字段)的資料類型:

STEP 1:單擊字段的字段類型圖示(如上表中所示)。

STEP 2: 從下拉清單中選擇一種新資料類型:

獨家 | 手把手教資料可視化工具Tableau

提示:確定在建立資料提取之前更改資料類型。否則,資料可能會不正确。舉例來說,如果 Tableau 将原始資料源中的浮點字段解釋為整數,并且您在更改字段的資料類型之前建立資料提取,則 Tableau 中生成的浮點字段的部分精度将被截斷。

3. 在“資料”窗格中更改字段的資料類型

若要在“資料”窗格中更改字段的資料類型,請單擊字段名稱左側的圖示,然後從下拉清單中選擇一種新資料類型。

獨家 | 手把手教資料可視化工具Tableau

4. 在視圖中更改字段的資料類型

若要在視圖中更改字段的資料類型,請在“資料”窗格中右鍵單擊(在 Mac 中按住 Control 單擊)字段,選擇“更改資料類型”,然後從下拉清單中選擇相應資料類型。

獨家 | 手把手教資料可視化工具Tableau

注意: 有時,資料庫中資料的精度比 Tableau 可以模組化的精度更高。在将這些值添加到視圖中時,狀态欄的右側将顯示一個精度警告。

5. 檔案中資料的混合資料類型

Microsoft Excel、Microsoft Access、或 CSV(逗号分隔值)檔案中的大多數列都包含相同資料類型(布爾值、日期、數字或文本)的值。 連接配接到該檔案時,Tableau 會在“資料”窗格的相應區域中為每列建立一個字段,日期和文本值為次元,數字為度量。

但是,您連接配接到的檔案所包含的列可能具有混合資料類型,例如數字和文本,或者數字和日期。連接配接到該檔案時,混合值列将映射到 Tableau 中具有單一資料類型的字段。是以,包含數字和日期的列可能會映射為數字資料類型(将其設為度量),或者可能會映射為日期資料類型(這種情況下 Tableau 将其視為次元)。

Tableau 根據 Excel 資料源中前 10,000 行和 CSV 資料源中前 1,024 行的資料類型來确定如何将混合值列映射為資料類型。舉例來說,如果前 10,000 行中大多數為文本值,那麼整個列都映射為使用文本資料類型。

注意: 空單元格也可以建立混合值列,因為它們的格式不同于文本、日期或數字。

當 Tableau 确定每個字段的資料類型時,如果某個字段中的值與該資料類型不比對, Tableau 就會采用若幹不同方式之一來處理字段,具體情況視資料類型而定。例如,有時 Tableau 會用 Null 值填充那些字段,如下表中所示:

獨家 | 手把手教資料可視化工具Tableau

如果在分析資料時使用基于混合值列的字段時遇到困難,則可以執行以下操作之一:

對基礎資料源中的空單元格設定格式,使它們與列的資料類型相比對。

建立一個不包含混合值的新列。

字段類型

連接配接到新資料源時,Tableau 會将該資料源中的每個字段配置設定給“資料”窗格的“次元”區域或“度量”區域,具體情況視字段包含的資料類型而定。如果字段包含分類資料(例如名稱、日期或地理資料),Tableau 會将其配置設定給“次元”區域;同理如果字段包含數字,Tableau 則會将其配置設定給“度量”部分。

那麼,可不可以說次元就是包含分類資料(例如名稱、日期或地理資料)的字段,度量就是包含數字的字段?以這些斷言作為出發點是足夠準确的,但當您在 Tableau 中工作時,請記住您可以控制視圖中字段的定義。根據使用者的要求,大多數字段都可用作次元或用作度量,并且可以為連續或離散。

Tableau 将字段配置設定給“次元”區域或“度量”區域進行初始配置設定時建立了預設值。當您單擊并将字段從“資料”窗格拖到視圖時,Tableau 将繼續提供該字段的預設定義。如果從“次元”區域中拖動字段,視圖中生成的字段将為離散字段(帶有藍色背景);如果從“度量”區域中拖動字段,生成的字段将為連續字段(帶有綠色背景)。

注意:如果您希望能夠訓示 Tableau 如何将拖到視圖的某個字段進行分類,以便覆寫預設值,請在将其拖到視圖之前右鍵單擊(在 Mac 上按住 Control 單擊)該字段,Tableau 将提示您在指定放下該字段時如何在視圖中使用它。

預設情況下,次元是離散的,度量是連續的,但事實上所有四種組合都有可能:

獨家 | 手把手教資料可視化工具Tableau

注意: 對于多元資料集(多元)資料源(僅在 Windows 上受支援),它用于更改資料角色的選項受到限制。您可以将某些度量從連續更改為離散,但通常無法更改多元資料集資料源中字段的資料角色。

1. 次元和度量

當您連接配接到資料源時,Tableau 會将資料源中的每個字段配置設定為扮演兩個可能的資料角色之一:次元或度量。 當您開始在 Tableau 中處理資料時,這些配置設定有什麼效果?

1.1 次元

當您第一次連接配接到資料源時,Tableau 會将包含離散分類資訊的任何字段(例如,值為字元串或布爾值的字段)配置設定給“資料”窗格中的“次元”區域。

當您單擊并将字段從“次元”區域拖到“行”或“列”時,Tableau 将建立列或行标題。

獨家 | 手把手教資料可視化工具Tableau

從“次元”區域拖出的任何字段在添加到視圖時一開始為離散,帶有藍色背景。是以,您可能會順理成章地假定字段的背景顔色指明了它是次元還是度量(但結果證明這樣做是不正确的)。但是日期次元和數值次元可能為離散次元或連續次元,所有度量也都可能為離散度量或連續度量。字段的背景顔色指明它是離散(藍色)還是連續(綠色)。

将次元拖到“行”或“列”時,隻需通過單擊字段并選擇“度量”便可将字段更改為度量。現在,視圖将包含一個連續軸(而不是列或行标題),并且字段的背景将變為綠色:

獨家 | 手把手教資料可視化工具Tableau

如果要将次元設為連續(在未首先将其轉換為度量的情況下),則您的選項有限。您隻能對日期次元(日期次元可能為離散或連續,但始終是次元)和數值次元這樣做,并且您無法轉換包含字元串或布爾值的次元。

Tableau 不會對次元進行聚合。如果要對字段的值進行聚合,則該字段必須為度量。将次元轉換為度量時,Tableau 将始終提示您為其配置設定聚合(計數、平均值等)。聚合表示将多個值(單獨的數字)聚集為一個數字,通過對單獨值進行計數、對這些值求平均值或顯示資料源中任何行的最小單獨值來實作。有關 Tableau 可執行的不同類型聚合的論述,請參見聚合(http://onlinehelp.tableau.com/current/pro/desktop/zh-cn/calculations_aggregation.html)。

在 Tableau 查詢中,視圖中的次元的 SQL 表示形式為“Group By”子句。

1.2 度量

當您第一次連接配接到資料源時,Tableau 會将包含定量數值資訊的任何字段(即其中的值為數字的字段)配置設定給“資料”窗格中的“度量”區域。

當您将字段從“度量”區域拖到“行”或“列”時,Tableau 将建立連續軸。

獨家 | 手把手教資料可視化工具Tableau

從“度量”區域拖出的任何字段在添加到視圖時一開始将為連續,是以其背景将顯示為綠色,但如果您單擊字段并選擇“離散”,則值将變為列标題。

獨家 | 手把手教資料可視化工具Tableau

然而Tableau 會繼續對字段的值進行聚合。因為即使該字段現在為離散,但它仍然是度量,而 Tableau 會始終對度量進行聚合。如果有意願您可以再進一步執行過程,将度量轉換為次元。隻有這樣,Tableau 才會停止對其值進行聚合。

1.3 視圖中次元和度量的可視辨別

如果您在 Tableau Desktop 中檢視視圖,并且不确定某個字段是度量還是次元,一個快速的視覺提示已聚合度量: 

而次元則不是:。

但是存在以下例外:

如果解聚整個視圖,則不會根據定義來聚合視圖中的字段。如果您使用的是多元資料源,則會在資料源中聚合字段,但視圖中的字段不顯示該聚合。

1.4 将度量轉換為次元

您可以将視圖中的字段從度量轉換為次元。

或者,如果您希望變更影響工作簿中所有的将來使用該字段的情形,您可将“資料”窗格中的字段從度量轉換為次元。

1)将視圖中的度量轉換為離散次元

您可以從“資料”窗格中的“度量”區域拖動字段,但随後将其用作視圖中的次元。例如,假設您想要了解每個可能的折扣率的聚合總銷售額,那麼您期望的視圖如下所示:

獨家 | 手把手教資料可視化工具Tableau

“Discount”(折扣)字段包含數值資料,是以當您連接配接到資料源時,Tableau 會将其配置設定給“資料”窗格中的“度量”區域。在 Tableau Desktop 附帶的“Sample - Superstore”資料源中,“Discount”(折扣)的值範圍為 0% 至 80%。

下面是用于建立上面所示的視圖的步驟:

STEP 1: 将“Sales”(銷售額)拖到“行”,将“Discount”(折扣)拖到“列”。Tableau 将顯示一個散點圖 — 這是當您将一個度量放在“行”上并将另一個度量放在“列”上時的預設圖表類型。

獨家 | 手把手教資料可視化工具Tableau

Tableau 以 AVG 形式聚合“Discount”(折扣),并以 SUM 形式聚合“Sales”(銷售額)。這些字段都是連續的,是以 Tableau 将沿視圖的底部和左側顯示軸(而不是列或行标題)。

STEP 2: 若要将“Discount”(折扣)視為次元,請單擊字段(在“列”功能區上)的下拉箭頭,并從上下文菜單中選擇“次元”。Tableau 不再聚合“Discount”(折扣)的值,是以您現在将看到一條線;但“Discount”(折扣)的值仍然是連續的,是以 Tableau 仍将為兩個字段顯示連續軸:

獨家 | 手把手教資料可視化工具Tableau

STEP 3: 再次單擊“Discount”(折扣)并從上下文菜單中選擇“離散”以完成該過程。“Discount”(折扣)的轉換現已完成,您現在将看到本主題開頭初始圖像中的條形圖。您現在将在底部看到列标題(0%、10%、20% 等),而不是軸。

讓我們回顧一下我們是如何實作此目标的:

獨家 | 手把手教資料可視化工具Tableau

現在隻需将“Sales”(銷售額)拖到“标簽”,然後設定标簽格式以提高可讀性。

由于資料源中的“Discount”(折扣)隻有 12 個唯一的值,是以生成的圖表有一定作用。假如每行有一個唯一的值(這種情況對于數值字段很少見),那麼生成的視圖中單獨條形的數量将與資料源中的行數相等,生成的可視化内容将有可能不起用。

2)将“資料”窗格中的度量轉換為次元

當您第一次連接配接到資料源時,Tableau 會将包含定量數值資訊的大多數字段(即其中的值為數字的字段)配置設定給“資料”窗格中的“度量”區域。對于名稱表明資料類型的字段,例如“年”或“月”(Tableau 會将其識别為“日期”次元),或者包含諸如“ID”和“鍵”的字詞的字段(Tableau 會将其分類為次元,即使這些字段是數值字段),則情況有所不同。

但是,您可能會決定 Tableau 已分類為度量的其中一些字段實際上應該是次元。郵政編碼是很經典的示例 — 它們通常完全由數字組成,但資訊是分類資訊而不是連續資訊 — 您絕不會希望通過對郵政編碼進行加總或求平均值來聚合郵政編碼。

同樣,在 Tableau 中,預設情況下可能會将包含單獨年齡的字段分類為度量,因為它包含數值資料。在某些情況下,您可能想要對年齡進行加總或求平均值,但也可能想要以資料桶或類别的形式檢視每個單獨的年齡,這種情況下您會希望 Tableau 為此字段建立标題(而不是軸)。如果希望以這種形式在視圖中使用年齡,您可以将字段轉換為次元。

若要在“資料”窗格中将度量轉換為次元,請執行以下任一操作。

單擊該字段并将其從“資料”窗格的度量區域拖放到次元區域中。

獨家 | 手把手教資料可視化工具Tableau

在“資料”窗格中右鍵單擊(在 Mac 上按住 Control 單擊)度量,并選擇“轉換為次元”。

如果将從度量轉換為次元的字段放在功能區上,則該字段會生成标題(而不是軸)。

獨家 | 手把手教資料可視化工具Tableau

1.5 次元和詳細級别

将次元添加到“行”或“列”時,視圖中标記的數量會增加。若要了解為何添加次元會增加視圖中标記的數量,請執行以下操作:

STEP 1:将“Segment”(細分市場)拖到“列”。

Tableau 視窗底部的狀态欄顯示視圖中現在有三個标記:

獨家 | 手把手教資料可視化工具Tableau

這些标記隻包含占位符文本 Abc,因為您此時隻建構了視圖的結構。

STEP 2: 将“Region”(區域)拖到“列”。

現在有 12 個标記。“Segment”(細分市場)中的三個值乘以“Region”(區域)中的四個值,結果為 12。

STEP 3:将“[Ship Date]”([發貨日期])拖到“行”。

現在共有 57 個标記(三個細分市場乘以四個區域,再乘以五年,結果為 60,但視圖中有三個在資料源中沒有資料的次元組合)。

我們可繼續向“行”和“列”中添加次元,并能觀察到标記的總數持續增加。将次元拖到“标記”卡上的一個位置(例如“顔色”或“大小”)将也會增加标記的數量,但不會增加視圖中标題的數量。向視圖中添加次元來增加标記數量的過程稱為設定詳細級别。

将次元添加到 Tableau 中的以下任何位置會對詳細級别産生影響:

獨家 | 手把手教資料可視化工具Tableau

STEP 4:視圖現在包含 57 個單獨的 Abc 執行個體 — 視圖都是結構,沒有内容。通過将“Sales”(銷售額)拖到到“文本”來調整這一點。現在可以認為視圖是完整的:

獨家 | 手把手教資料可視化工具Tableau

說明:

1. 某些情況下,向視圖中添加度量可能會增加視圖中标記的數量。舉例來說,如果将“Sales”(銷售額)放在上面視圖中的“行”上,标記的數量為 57;但如果随後也将“Profit”(利潤)放在“行”上,标記的數量将增加到 114。但這與更改視圖的詳細級别不同。

2. 視圖中标記的數量并不保證會與您将組成詳細級别的每個次元中的次元值數量相乘所得到的數量對應,而标記數量可能較低的原因有多種。若要将此視圖中标記的數量從 57 增加到上面視圖中的 60,請右鍵單擊(在 Mac 上按住 Control 單擊)視圖中的日期标題之一以及日期或資料桶标題,并選擇“顯示缺失值”。

獨家 | 手把手教資料可視化工具Tableau

2. 連續和離散

連續和離散是數學術語,連續意指“構成一個不間斷的整體,沒有中斷”;離散意指“各自分離且不同”。

在 Tableau 中,字段可分為連續或離散。當您将字段從“度量”區域拖到“列”或“行”時,值預設情況下将是連續的,并且 Tableau 将建立軸;将字段從“資料”窗格的“次元”區域拖到“列”或“行”時,值預設情況下将是離散的,并且 Tableau 将建立列或行标題。讓我們考慮一下為何為這樣。

2.1 連續字段生成軸

如果字段包含可以加總、求平均值或以其他方式聚合的數字,則 Tableau 會在您第一次連接配接到資料源時将該字段配置設定給“資料”窗格的“度量”區域。Tableau 假定這些值是連續的。

當您将連續字段放在“行”或“列”上時,Tableau 會顯示一個軸。軸是一個顯示最小值和最大值之間的值的度量線,标尺和模拟溫度計是顯示軸的物品的例子。

Tableau 必須能夠顯示一系列實際值和可能值,因為除了資料源中的初始值之外,您在視圖中處理連續字段時始終可能會出現新值。

盡管連續軸上有值标簽(下圖中的 0、0.5、... 3.0),但實際标記不必像與列标題對齊一樣與這些标簽對齊。例如,在下圖中,藍色條形實際上延伸到了水準軸上的值 6.940,而不是确切地延伸到 7.0。

獨家 | 手把手教資料可視化工具Tableau

連續字段的可能值的數量無法預計。舉例來說,如果有一個名為“Rating”(評級)的字段,并且初始值為 1、3、3.5、3.6 和 4,即五個離散值。但如果您将“Ratings”(評級)放在“行”上,Tableau 會自動以 SUM 的形式聚合該值(您随後會立即将其更改為 AVG,因為與将等級加總相比,對等級求平均值更有邏輯),而這樣會随後建立第六個值 (3.02),在您向視圖中添加字段之前,該值并不存在。并且,如果您随後應用了排除兩個初始值的篩選器,平均值也将更改,該值會将是另一個值。然後您更改了聚合,... 您就明白了。可能值的數量即使不是無限,也肯定是巨大的。

字段包含數字的事實并不必然表明這些值是連續的。郵政編碼就是很經典的例子:盡管郵政編碼通常完全由數字組成,但它們實際應該是絕不會加總或求平均值的字元串值。如果 Tableau 将此類字段配置設定給“度量”區域,您應将其拖到“次元”區域。

2.2 離散字段建立标題

如果某個字段包含的值是名稱、日期或地理位置(不是數字的任何内容),Tableau 會在您第一次連接配接到資料源時将該字段配置設定給“資料”窗格的“次元”區域,Tableau 将值視為離散。

當您将離散字段放在“列”或“行”上時,Tableau 會建立标題,離散字段的單獨值将成為行或列标題。(由于絕不會對此類值進行聚合,是以在您處理視圖時不會建立新字段值,是以就不需要軸。)

2.3 辨識差異

如果字段為連續,則背景顔色為綠色;如果字段為離散,則背景顔色為藍色。背景顔色并非指明次元與度量的對比,而是指明連續與離散的對比。

辨識視圖中的字段是度量還是次元的依據在于該字段是否已聚合。

在下面左側的視圖中,從“資料”窗格的“度量”區域中拖來的“Quantity”(數量)已從度量轉換為次元,但仍然是連續的,在視圖的底部顯示了一個軸。我們之是以知道該字段是連續的,原因就在于該軸,并且它的背景為綠色;而我們之是以知道該字段是次元,原因在于它未聚合。

在右側的視圖中,已認證在“列”功能區上單擊“Quantity”(數量)并選擇“離散”對視圖進行了進一步修改。 現在視圖的底部顯示标題,而不是軸。

獨家 | 手把手教資料可視化工具Tableau

2.4 應包括在視圖中的離散字段

當您将離散字段放在“篩選器”功能區上時,Tableau 将提示您選擇應在視圖中包括離散字段的哪些“成員”。

獨家 | 手把手教資料可視化工具Tableau

将“日期”字段放在“篩選器”上時,結果可能為離散篩選器或連續篩選器。

當您将連續度量放在“篩選器”上時,Tableau 将首先提示您為篩選器選擇聚合,然後提示您指定如何對連續的值範圍進行篩選。

當您将連續次元放在“篩選器”(而不是“日期”)上時,Tableau 将提示您指定如何對連續的值範圍進行篩選。

2.5 顔色的含義

當您将離散字段放在“顔色”上時,Tableau 将顯示一個分類調色闆,并為字段的每個值配置設定一種顔色。

當您将連續字段放在“顔色”上時,Tableau 将顯示一個具有連續顔色範圍的定量圖例。

2.6 在離散和連續之間轉換字段

您可以将度量從離散轉換為連續,或從連續轉換為離散。并且,您可以将日期次元和其他數值次元轉換為離散或連續。

轉換度量

您可以将度量從離散轉換為連續,或從連續轉換為離散。單擊字段并選擇“離散”或“連續”,字段為連續時将顯示為綠色,字段為離散時将顯示為藍色。

對于“資料”窗格中的度量,右鍵單擊字段并選擇“轉換為離散”或“轉換為連續”,那麼字段的顔色将相應發生變化。

轉換日期字段

您可以在離散和連續之間轉換日期字段。單擊視圖中的任何日期字段,并選擇上下文菜單上的選項之一,便可将該字段從離散轉換為連續,或從連續轉換為離散:

獨家 | 手把手教資料可視化工具Tableau

1. 單擊藍色區域中的任何選項可将字段配置為離散日期。

選擇這些選項之一将建立所謂的“日期部分”。

2. 單擊綠色區域中的任何選項可将字段配置為連續日期。

選擇這些選項之一将建立所謂的“截斷日期”。

若要轉換“資料”窗格中的日期字段(并是以确定在将該字段拖到視圖中時的預設結果),請右鍵單擊該字段并選擇“轉換為離散”或“轉換為連續”。

Tableau的操作順序

Tableau 中的操作順序(有時稱為查詢管道)是指 Tableau 将執行各種動作的順序(動作也稱為操作)。

許多操作都應用篩選器,這意味着,在您建構視圖和添加篩選器時,這些篩選器始終按操作順序所建立的順序執行。

有時,您可能預計 Tableau 會按一個順序執行篩選器,但操作的順序決定的篩選器按不同的順序執行,則結果可能會出人意料。如果發生這種情況,您有時可以更改操作在管道中執行的順序。

本主題提供了兩個用于更新視圖來糾正解決操作順序所産生問題的方案:将次元篩選器轉換為上下文篩選器,以及将表計算轉換為 FIXED 詳細級别表達式。

Tableau 的操作順序包括下面闡述的所有元素。篩選器顯示為藍色;其他操作(大多數為計算)顯示為黑色。

獨家 | 手把手教資料可視化工具Tableau

示例 1:将次元篩選器轉換為上下文篩選器

本示例以及以下示例使用 Tableau Desktop 附帶的“Sample – Superstore”資料源。

在此示例中,視圖解決以下這個問題:按總銷售額計,紐約市位居前 10 名的客戶有哪些?

視圖包含兩個次元篩選器,一個是您在“篩選器”對話框的“正常”頁籤上建立的篩選器,另一個是在“前 N 個”頁籤上建立的篩選器。問題在于,這些篩選器是同時執行的,而您希望正常篩選器在“前 N 個”篩選器之前應用,以便“前 N 個”篩選器可對正常篩選器預先篩選的結果進行操作。此解決方案是将其中一個篩選器重新定義為上下文篩選器,以便建立清晰的優先級順序。

下面是用于建構此視圖的步驟:

STEP 1:将“Sales”(銷售額)拖到“列”。

STEP 2:将“City”(城市)和“[Customer Name]”([客戶名稱])拖到“行”。

STEP 3:再次從“資料”窗格中拖出“City”(城市),這次将其拖到“篩選器”。在“篩選器”對話框的“正常”頁籤上,将篩選器設定為僅顯示單一值:“New York City”(紐約市),通過單擊“無”然後選擇“New York City”(紐約市)可達到此目的。

這将建立一個正常次元篩選器。

STEP 4:單擊工具欄上的“降序排序”按鈕 (

獨家 | 手把手教資料可視化工具Tableau

)。視圖現在将如下所示:

獨家 | 手把手教資料可視化工具Tableau

注意清單中的前幾個名稱:Ashbrook、Fuller、Vernon 等。

STEP 5:現在将“[Customer Name]”([客戶名稱])從“資料”窗格拖到“篩選器”,并建立一個“前 10 個”篩選器,以僅顯示按總銷售額計的前 10 名客戶。

獨家 | 手把手教資料可視化工具Tableau

應用了第二個篩選器後,視圖看起來是正确的,但您會注意到顯示的名稱與之前不再相同:

獨家 | 手把手教資料可視化工具Tableau

之前位于第二位的 Peter Fuller 發生了什麼情況?目标是顯示紐約市的前 10 名客戶,但現在視圖實際顯示的是總體的前 10 名客戶。

問題在于“前 N 個”篩選器和正常次元篩選器是同時應用的 — 它們都是次元篩選器,并且按 Tableau 操作順序出現在同一位置:

獨家 | 手把手教資料可視化工具Tableau

解決方案是向上下文中添加(針對“City”(城市))的正常次元篩選器 — 也就是說,将其轉換為一個上下文篩選器,該篩選器将先于在工作表中建立的任何其他篩選器執行。

有關詳細資訊,請參見使用上下文篩選器提高視圖性能(http://onlinehelp.tableau.com/current/pro/desktop/zh-cn/filtering_context.html)。

STEP 6:在“篩選器”功能區上右鍵單擊(在 Mac 上按住 Control 單擊)“City”(城市),并選擇“添加到上下文”。作為上下文篩選器,此篩選器現在優先于次元篩選器,是以視圖現在将按預期方式顯示:

獨家 | 手把手教資料可視化工具Tableau

示例 2:将表計算轉換為 FIXED 詳細級别表達式

在此示例中,視圖将解決以下這個問題:占總銷售額的百分比将如何按産品子類列出?

視圖包含一個次元篩選器和一個表計算。Tableau 會在執行表計算之前應用次元篩選器。若要反轉這些操作的順序,請使用 FIXED 詳細級别表達式來取代表計算。

STEP 1:在新工作表中,将“Sales”(銷售額)拖到“列”。

STEP 2:将“Sub-Category”(子類)拖到“行”。

STEP 3:在“列”上右鍵單擊“SUM(Sales)”并選擇快速表計算 –“總額百分比”。

獨家 | 手把手教資料可視化工具Tableau

),按從最多到最少的順序對類别進行排序。

STEP 5: 單擊工具欄上的“顯示标記标簽”按鈕 (

獨家 | 手把手教資料可視化工具Tableau

),以在視圖中顯示路徑成本。

視圖現在将如下所示:

獨家 | 手把手教資料可視化工具Tableau

注意前幾項的百分比:14.37%、14.30% 等。

STEP 6: 在“行”上右鍵單擊“Sub-Category”(子類),并選擇“顯示篩選器”。

STEP 7:清除篩選器中“Chairs”(椅子)的複選标記。

獨家 | 手把手教資料可視化工具Tableau

視圖中的百分比現在有所不同 — 現在最高的百分比超過了16%。在某些情況下,這可能就是您需要的結果(也就是說,在使用快速篩選器時對百分比進行了重新計算)。但在其他情況下,您可能希望百分比即使在您篩選進或篩選出某些項目時也保持穩定。這是我們在本例中所需要的。

在操作順序中,次元篩選器是在表計算之前應用的。

獨家 | 手把手教資料可視化工具Tableau

若要讓 Tableau 在運用快速篩選器之前計算百分比,您可以建立一個 FIXED 詳細級别表達式,然後使用該表達式來取代表計算。

FIXED 詳細級别表達式使用指定的次元計算值,而不引用視圖中的次元。在本例中,您将使用它來建立各個子類的百分比 — 不會受正常次元篩選器影響的百分比。為何會這樣?原因是FIXED 詳細級别表達式是在應用次元篩選器之前計算的。

STEP 8:FIXED 詳細級别表達式必須将(特定路徑成本的)“Sales”(銷售額)的和除以視圖的“Sales”(銷售額)的總和。由于分子是聚合的,是以分母也必須為聚合,是以您編寫的表達式為:

SUM([Sales])/SUM({FIXED : SUM([Sales])})

STEP 9: 将該表達式另存為 FixedSumOfSales,然後将其從“資料”窗格拖到“列”,放在使用表計算的現有“SUM(Sales)”字段的右側(将兩者都保留在視圖中以便于比較)。您現在的視圖為如下所示:

獨家 | 手把手教資料可視化工具Tableau

不管您使用快速篩選器選擇或者不選擇哪些字段,右側圖表中的百分比現在都保持一緻。現在隻需設定“FixedSumOfSales”值的格式,以使其顯示為百分比。

STEP 10:在“列”中右鍵單擊“FixedSumOfSales”,并選擇“設定格式”。在“設定格式”窗格中,選擇“數字”,然後選擇“百分比”:

獨家 | 手把手教資料可視化工具Tableau

這樣就得到了最終視圖:

獨家 | 手把手教資料可視化工具Tableau

當您在“Sub-Category”(子類)快速篩選器中選擇或清除項目時,左側條形圖中的百分比将發生變化,而右側條形圖中的百分比則不會。

使用Tableau案例

生成條形圖

使用條形圖可在各類别之間比較資料。建立條形圖時會将次元放在“行”功能區上,并将度量放在“列”功能區上,反之亦然。

條形圖使用條标記類型。當資料視圖與如下所示的兩種字段排列方式之一比對時,Tableau 會選擇此标記類型。您可以向這些功能區中添加其他字段。

有關條形标記類型的詳細資訊,請參見條形标記。

注意:在過程結束時,您可以執行一個額外步驟,在條形的頂部顯示合計。

獨家 | 手把手教資料可視化工具Tableau

若要建立顯示四年間的總銷售額的條形圖,請按照下列步驟操作:

STEP 1: 連接配接到“Sample - Superstore”資料源。

STEP 2:将“Order Date”(訂單日期)次元拖到“列”功能區。

資料按年份聚合,并将顯示列标題。

STEP 3: 将“Sales”度量拖到“行”功能區。

該度量将聚合為一個總和并将建立一個軸,列标題将移到視圖的底部。

由于您添加了日期次元,是以 Tableau 會使用“線”作為标記類型。

獨家 | 手把手教資料可視化工具Tableau

STEP 4: 在“标記”卡上,從視圖下拉清單中選擇“條形”。

獨家 | 手把手教資料可視化工具Tableau

視圖會更改為條形圖。

獨家 | 手把手教資料可視化工具Tableau

标記(在本例中為條)是垂直的,因為軸是垂直的。每個标記的長度表示那一年的銷售總額。您在此處看到的數字可能與實際數字不比對 — 示例資料會随時發生變化。

獨家 | 手把手教資料可視化工具Tableau

STEP 5: 将“Ship Mode”(裝運模式)次元拖到“标記”卡的“顔色”上。

視圖顯示了不同的裝運模式如何影響一段時間内的總銷售額,且每年的比率似乎都一緻。

獨家 | 手把手教資料可視化工具Tableau

STEP 6:将“Region”(區域)次元拖到“行”功能區,并将其放到“Sales”(銷售額)的左側,以便為地區銷售額生成多個軸。

獨家 | 手把手教資料可視化工具Tableau

STEP 7: 若要隻檢視西部區域的資料,您可以篩選掉其他區域。為此,請再次拖動“Region”(區域)次元,這次是從“資料”窗格拖到“篩選器”功能區。

獨家 | 手把手教資料可視化工具Tableau

STEP 8: 在“篩選器 [Region]”對話框中,清除“Central”(中部)、“East”(東部)和“South”(南部)複選框,然後單擊“确定”。

獨家 | 手把手教資料可視化工具Tableau

此視圖使您能深入了解您的資料,例如西部的裝運模式在四年期間内發生了怎樣的變化。

額外步驟:為堆疊條添加合計

将合計添加到圖表中條形的頂部的操作,有時就像通過在工具欄中單擊“顯示标記标簽”圖示一樣簡單。但是,當按顔色或大小分解條形時,則将标記每個單獨條形段而不是标記條形的合計。隻需幾步,您就可以向每個條形的頂部添加合計标簽,即使這些條形像您剛剛建立的視圖中一樣已經細分。從技術上來說,在以下過程中您将添加一條參考線,但需通過以特定方式配置該“參考線”,最終您将得到所需的标簽。

STEP 1: 從“分析”窗格中,将“參考線”拖到視圖中,并将其放在“單元格”上。

獨家 | 手把手教資料可視化工具Tableau

STEP 2:在“編輯參考線、參考區間或參考箱”對話框中,将“SUM(Sales)”的聚合設定為“總和”,将“标簽”設定為“值”,并将“格式設定”下的“線”設定為“無”:

獨家 | 手把手教資料可視化工具Tableau

然後單擊“确定”關閉“編輯參考線、參考區間或參考箱”對話框。

視圖中每個條形的頂部現在便有貨币總計:

獨家 | 手把手教資料可視化工具Tableau

您可能需要調整視圖以使其正常顯示。如果條形太窄,數字将被截斷;若要修複這一點,請在鍵盤上按 Ctrl + 向右鍵以使條形更寬。或者,如果您想要使合計在條形上居中顯示 — 預設情況下,合計以靠左對齊方式顯示,請執行以下操作:

STEP 1:右鍵單擊條形圖上的任意合計并選擇“設定格式”。

STEP 2:在“設定格式”視窗的“參考線标簽”區域中,打開“對齊”控件“水準”對齊,并選擇“居中”選項。

獨家 | 手把手教資料可視化工具Tableau

生成熱圖

使用熱圖用顔色比較分類資料。

要在 Tableau 中建立熱圖,可将一個或多個次元分别放在“列”和“行”功能區上。然後選擇“方形”作為标記類型并将相關度量放在“顔色”功能區上。

可通過設定表單元格的大小和形狀來增強這種基本熱圖。

若要建立熱圖了解利潤如何随地區、産品子類和客戶細分市場變化,請按以下步驟進行操作:

STEP 1:連接配接到“Sample - Superstore”資料源。

STEP 2:将“Segment”(細分市場)次元拖到“列”功能區。

Tableau 将使用從次元成員名稱派生的标簽建立标題。

STEP 3:将“Region”(區域)和“Sub-Category”(子類)次元拖到“行”功能區,同時将“Sub-Category”(子類)放在“Region”(區域)的右側。

現在,您具有分類資料的嵌套表(即“Sub-Category”(子類)次元嵌套在“Region”(區域)次元内)。

STEP 4: 将“Profit”(利潤)度量拖到“标記”卡的“顔色”上。Tableau 将這兩個度量聚合為總和。顔色圖例反映出連續資料範圍。

STEP 5:優化視圖格式:

在“标記”卡上,選擇“方形”作為标記類型。

通過按 Ctrl + 右箭頭(在 Mac 上,此組合為 z")将列調寬;按下 Ctrl(或 z)并繼續按右箭頭,直到完全顯示段的标題為止。

通過按 Ctrl + Shift + B(在 Mac 上按:ñzB)來增加标記大小;按下 Ctrl + Shift (ñz) 并繼續按 B,直到方塊足夠大為止。

獨家 | 手把手教資料可視化工具Tableau

在此視圖中,您隻能看到中部地區的資料。向下滾動以檢視其他區域的資料。

在中部區域,影印機顯示為利潤最高的子類,而裝訂機和電器則是利潤最低的。

STEP 6:單擊“标記”卡上的“顔色”以顯示配置選項。在“邊框”下拉清單中為單元格邊框選擇中灰色,如下圖所示:

獨家 | 手把手教資料可視化工具Tableau

現在更容易看到視圖中的各個單元格:

獨家 | 手把手教資料可視化工具Tableau

STEP 7:預設調色闆為“橙色-藍色發散”,其中“紅色-綠色發散”調色闆可能更适合于利潤。若要更改調色闆并使顔色更鮮明,請執行以下操作:

将滑鼠指針懸停在“SUM(Profit)”顔色圖例上,然後單擊出現的下拉箭頭并選擇“編輯顔色”。

在“編輯顔色”對話框的“調色闆”字段中,從下拉清單中選擇“紅色-綠色發散”。

選中“使用完整顔色範圍”複選框,單擊“應用”,然後單擊“确定”。

獨家 | 手把手教資料可視化工具Tableau

選擇此選項時,Tableau 會為起始數字和結束數字都指定全色濃度。如果範圍為 -10 到 100,與表示正數的顔色相比,則表示負數的顔色在深淺上的變化要快得多。

如果未選擇“使用完整顔色範圍”,則 Tableau 會按 -100 到 100 這樣的範圍配置設定顔色濃度,是以零兩側的顔色濃度變化相同。這樣,您的視圖中的顔色對比度将會更加鮮明。

有關顔色選項的詳細資訊,請參見顔色屬性(http://onlinehelp.tableau.com/current/pro/desktop/zh-cn/ viewparts_marks_markproperties _color.html)。

獨家 | 手把手教資料可視化工具Tableau

STEP 8: 将“Sales”(銷售額)度量拖到“标記”卡上的“大小”以便通過“Sales”(銷售額)度量控制框的大小。您可以比較絕對銷售額(按框的大小)和利潤(按顔色)。

剛開始時标記如下:

獨家 | 手把手教資料可視化工具Tableau

STEP 9:若要放大标記,請單擊“标記”卡上的“大小”來顯示大小滑塊:

獨家 | 手把手教資料可視化工具Tableau

STEP 10:将滑塊向右拖動直到視圖中的框達到最佳大小。現在您的視圖是完整的:

獨家 | 手把手教資料可視化工具Tableau

STEP 11: 使用視圖右側的滾動條來檢查不同地區的資料。

生成填充氣泡圖

使用填充氣泡圖可以在一組圓中顯示資料。次元定義各個氣泡,度量定義各個圓的大小和顔色。

若要建立顯示不同産品類别的銷售額和利潤資訊的基本填充氣泡圖,請按以下步驟進行操作:

STEP 2:将“Category”次元拖到“列”功能區。水準軸顯示産品類别。

STEP 3: 将“Sales”度量拖到“行”功能區。度量将聚合為總和并将顯示一個垂直軸。當“列”功能區上有一個次元且“行”功能區上有一個度量時,Tableau 将顯示一個條形圖(預設圖表類型)。

STEP 4: 單擊工具欄上的“智能顯示”,然後選擇填充氣泡圖圖表類型。

獨家 | 手把手教資料可視化工具Tableau

Tableau 會顯示以下填充氣泡圖:

獨家 | 手把手教資料可視化工具Tableau

STEP 5: 将“Region”拖到“标記”卡上的“詳細資訊”以在視圖中包括更多氣泡。

獨家 | 手把手教資料可視化工具Tableau

接下來,我們将向視圖中添加另一層資訊。

STEP 6:将“Profit”(利潤)拖到“标記”卡上的“顔色”中:

獨家 | 手把手教資料可視化工具Tableau

STEP 7:将“Region”拖到“标記”卡上的“标簽”以說明每個氣泡所代表的内容。

獨家 | 手把手教資料可視化工具Tableau

氣泡的大小顯示不同的地區和類别組合的銷售額。氣泡的顔色表示利潤(綠色越深,利潤越高)。

為了進一步完善此視圖,您可以編輯“Profit”(利潤)的顔色,以使用不同的顔色差別地顯示負利潤,也可以建立顯示利潤除以銷售額(即利潤率)的計算字段,然後将該字段放置在“顔色”上,而不是建立絕對利潤字段。

如果您是Tableau Desktop的新使用者,同時請考慮完成自己動手練習,并在 Tableau 網站上觀看免費的教育訓練視訊。

原文釋出時間為:2017-09-28

本文作者:尹繼恒

<a href="https://mp.weixin.qq.com/s/l85rGm5-K9R8OgOzCD47yA#%23"></a>

本文來自雲栖社群合作夥伴“資料派THU”,了解相關資訊可以關注“資料派THU”微信公衆号

繼續閱讀