pandas数据透视表 pd.pivot_table()

2023-08-05 04:51:00

`pandas.pivot_table()`

几个重要的参数

data

：DataFrame对象

values

：源数据中的一列，数据透视表中用于观察分析的数据值，类似Excel中的值字段

index

：源数据中的一列，数据透视表用于行索引的数据值，类似Excel中的行字段

columns

：源数据中的一列，数据透视表用于列索引的数据值，类似Excel中列字段

aggfunc

：根据当前的行、列索引生成的数据透视表中有多个数据需要进行聚合时，对这多个数据需要进行的操作，默认为np.mean()

下面的Excel表格分别记录了武汉和北京一周（2018/07/22-2018/07/28）的日最高温度和日最低温度，对数据进行以下的分析：

pd.read_excel()

pandas数据透视表 pd.pivot_table()

pd.pivot_table()

，也可以用作method，

DataFrame.pivot_table()

pandas数据透视表 pd.pivot_table()

分析日平均最高温度时涉及到对两个城市日最高温度的取平均运算，需要设置参数

aggfunc=np.mean

（也可以不设置，默认情况下

aggfunc

为均值运算），日平均最低温度同理。这里设置行字段参数

index=['HT','LT']

可同时分析日平均最高和最低温度。

pandas数据透视表 pd.pivot_table()