天天看點

pandas資料透視表 pd.pivot_table()

pandas.pivot_table()

幾個重要的參數

data

:DataFrame對象

values

:源資料中的一列,資料透視表中用于觀察分析的資料值,類似Excel中的值字段

index

:源資料中的一列,資料透視表用于行索引的資料值,類似Excel中的行字段

columns

:源資料中的一列,資料透視表用于列索引的資料值,類似Excel中列字段

aggfunc

:根據目前的行、列索引生成的資料透視表中有多個資料需要進行聚合時,對這多個資料需要進行的操作,預設為np.mean()

示例資料集

下面的Excel表格分别記錄了武漢和北京一周(2018/07/22-2018/07/28)的日最高溫度和日最低溫度,對資料進行以下的分析:

  • 武漢、北京一周的日最高、最低氣溫趨勢變化;
  • 兩城市一周的平均日最高、最低氣溫變化趨勢;
    pandas資料透視表 pd.pivot_table()

    HT: the highest temperature, 日最高氣溫

    LT: the lowest temperature, 日最低氣溫

建立DataFrame對象

pd.read_excel()

pandas資料透視表 pd.pivot_table()

分别分析日最高、最低溫度

pd.pivot_table()

,也可以用作method,

DataFrame.pivot_table()

pandas資料透視表 pd.pivot_table()

分析日平均最高、最低溫度

分析日平均最高溫度時涉及到對兩個城市日最高溫度的取平均運算,需要設定參數

aggfunc=np.mean

(也可以不設定,預設情況下

aggfunc

為均值運算),日平均最低溫度同理。這裡設定行字段參數

index=['HT','LT']

可同時分析日平均最高和最低溫度。

pandas資料透視表 pd.pivot_table()