pandas.pivot_table()
pandas.pivot_table()
幾個重要的參數
data
:DataFrame對象
values
:源資料中的一列,資料透視表中用于觀察分析的資料值,類似Excel中的值字段
index
:源資料中的一列,資料透視表用于行索引的資料值,類似Excel中的行字段
columns
:源資料中的一列,資料透視表用于列索引的資料值,類似Excel中列字段
aggfunc
:根據目前的行、列索引生成的資料透視表中有多個資料需要進行聚合時,對這多個資料需要進行的操作,預設為np.mean()
示例資料集
下面的Excel表格分别記錄了武漢和北京一周(2018/07/22-2018/07/28)的日最高溫度和日最低溫度,對資料進行以下的分析:
- 武漢、北京一周的日最高、最低氣溫趨勢變化;
- 兩城市一周的平均日最高、最低氣溫變化趨勢;
pandas資料透視表 pd.pivot_table() HT: the highest temperature, 日最高氣溫
LT: the lowest temperature, 日最低氣溫
建立DataFrame對象
pd.read_excel()
分别分析日最高、最低溫度
pd.pivot_table()
,也可以用作method,
DataFrame.pivot_table()
分析日平均最高、最低溫度
分析日平均最高溫度時涉及到對兩個城市日最高溫度的取平均運算,需要設定參數
aggfunc=np.mean
(也可以不設定,預設情況下
aggfunc
為均值運算),日平均最低溫度同理。這裡設定行字段參數
index=['HT','LT']
可同時分析日平均最高和最低溫度。