開始講Power Query之前,不得不先講一下資料進行中的ETL(Extract-Transform-Load的縮寫)。ETL指将資料從“資料源”經過“提取–轉換–加載”三個步驟至“結果”的通用過程。
提到ETL工具,資料行業專業人士可能首先想到的是Datastage、Informatica 、ODI和SSIS等等,還有還多開源的ETL工具,如Kettle、Apache Camel、Kafka等。沒錯,這些都是專業的ETL工具,而且都有各自的特點,但是這些是企業級的大型軟體,似乎離我們都比較遠,除非是資料行業從業者,否者可能這輩子都沒有機會學習和使用這些工具。
不要灰心,辦公必備軟體Office中就提供了一組功能強大的 “擷取和轉換” 功能, 可為使用者提供快捷的資料收集和整理功能,這個功能就是–Power Query(通常簡稱為PQ),PQ就是大家唾手可得的友善易用的資料加載和資料清洗工具。
Power Query的功能可以在Excel或者Power BI Desktop中使用,不同版本的Excel中用法也不同。
- 依次單擊【檔案】=>【賬戶】=>【關于Excel】可以檢視Excel版本資訊。
- Office 2010和Office 2013中需要安裝Power Query插件
PQ插件官方下載下傳位址: https://www.microsoft.com/zh-cn/download/details.aspx?id=39379
支援的Office 版本:
Microsoft Office 2010 Professional Plus
Microsoft Office 2013
支援的作業系統:
Windows 7 / 8 / 8.1
Windows Server 2008 R2 / 2013
Power Query需要Internet Explorer 9或者更高版本,如Windows 7中未安裝相應更新,仍然使用預設安裝的IE8,那麼将無法使用Excel的Power Query功能。
- Office 2016、Office 2019和Office 365中已經內建Power Query功能,可以直接使用。
-
如果希望體驗Power BI Desktop中的Power Query,可以從如下頁面下載下傳。
https://powerbi.microsoft.com/zh-cn/desktop/
接下來将使用Excel 2016講解Power Query功能,Office 2019和Office 365中Power Query的使用方法與此基本一緻,有些操作界面可能會略有不同。
Excel 2016中Power Query功能位于【資料】頁籤的【擷取和轉換】組中,如下圖所示。