天天看點

人人都是資料分析師:Tableau應用實戰(二)資料連接配接與管理

連接配接資料源是利用Tableau進行資料分析的第一步,Tableau擁有強大的資料連接配接能力,支援幾乎所有的主流資料源類型。

本節目标:實作多表聯接查詢和多資料源資料關聯,建立、管理和操作資料源。

Tableau中繼資料管理分為三層:資料連接配接層(Connection)、資料模型層(DataModel)和資料可視化層(VizQL)。

Tableau中的資料連接配接層

資料連接配接層的資料連接配接資訊包括資料庫、資料表、資料視圖、資料列,以及用于擷取資料的表連接配接和SQL腳本,但是資料連接配接層不儲存任何源資料

人人都是資料分析師:Tableau應用實戰(二)資料連接配接與管理

Tableau中的資料模型層

在完成資料連接配接後,Tableau會自動判斷字段的角色,把字段分為次元字段和度量字段兩類。如果所連接配接資料是多元資料源,那麼Tableau直接擷取資料立方體次元和度量資訊;如果連接配接的是關系資料源,Tableau會根據資料庫的資料來判斷該字段是次元字段還是度量字段。

多元資料庫(我也不懂(略))

本節我們主要講解如何連接配接excel和mysql。

連接配接mysql:

人人都是資料分析師:Tableau應用實戰(二)資料連接配接與管理

複制粘貼輸入資料

人人都是資料分析師:Tableau應用實戰(二)資料連接配接與管理

篩選資料

直接使用資料源的全量資料,在視圖設計時可能會導緻工作表響應遲緩。如果僅希望對部分資料進行分析,可以使用資料源篩選器。Tableau可以在建立資料源時選擇篩選器,也可以在完成資料連接配接後,對資料源添加篩選器。

人人都是資料分析師:Tableau應用實戰(二)資料連接配接與管理

資料整合

Tableau的資料整合功能可實作同一資料源的多表聯結、多個資料源的資料融合,以及針對源資料的行列轉換。

人人都是資料分析師:Tableau應用實戰(二)資料連接配接與管理

說明 聯接類型分為内部、左側、右側、完全外部4種。其中“内部”隻列出與聯接條件比對的

資料行;“左側”表示不僅包含查詢結果集合中符合聯接條件的行,而且還包括左表的所

有資料行;“右側”表示不僅包含查詢結果集合中的符合聯接條件的行,而且還包括右表

的所有資料行;“完全外部”表示包含查詢結果集合中的包含左、右表的所有資料行。

實作多個資料庫的多表連接配接

人人都是資料分析師:Tableau應用實戰(二)資料連接配接與管理

行列轉換 利用資料透視表可以實作行列轉換

人人都是資料分析師:Tableau應用實戰(二)資料連接配接與管理

Tableau加載資料有兩種基本方式:一種是實時連接配接,即Tableau從資料源擷取查詢結果,本

身不存儲源資料;另一種是資料提取,将資料提取到Tableau的資料引擎中,由Tableau進行管理。本節重點介紹資料提取。

在下列情況下,建議使用資料提取的方式。

 源資料庫的性能不佳:源資料庫的性能跟不上分析速度的需要,則可以由Tableau的資料引擎來提供快速互動式分析。

 需要脫機通路資料:如果需要在差旅途中脫機通路資料,則可以将相關資料提取到本地。

 減輕源系統的壓力:如果源系統是重要的業務系統,那麼建議将資料通路轉移到本地,以減輕對源系統的壓力。

而在下列情況下,則不建議選擇資料提取方式。

 源資料庫性能優越:IT基礎設施支援快速資料分析,那麼不建議進行資料複制。

 資料的實時性要求高:需要使用實時更新的資料進行分析,則不建議使用資料提取的方式。

 資料的保密要求高:出于資訊安全考慮不希望将資料儲存在本地,則不建議進行資料提取

建立資料提取

Tableau有兩種方式建立資料提取:一種是完成資料連接配接之後,針對資料源進行提取資料操作;另一種是在建立資料源時選擇“提取”方式。

……(略)

繼續閱讀