天天看點

關于DataFrame執行groupby的介紹關于DataFrame執行groupby的介紹

關于DataFrame執行groupby的介紹

pandas提供了一個靈活高效的groupby功能,它使你能以一種自然的方式對資料集進行切片、切塊、摘要等操作。這裡我們主要關注DataFrame執行groupby聚合操作後,如何繼續保持DataFrame對象,讓其不變成Series對象。

如一下執行個體:

我們輸出的一個DateFrame資料集 df,

key  value
0   a      1
1   b      2
2   b      3
3   c      4
4   a      5
5   a      6
6   b      7
7   a      8
8   c      9
           

接下來我們要對key列重複的資料進行合并,一般語句為:

df1 = df.groupby(('key')).sum()

           

則有結果如下第一部分,此時不再是DataFrame對象,而變成Series對象,如下第二部分:

df1 = df.groupby(('key')).sum()

     value
key       
a       20
b       12
c       13

           
df['value']

[('value', key
a    20
b    12
c    13
Name: value, dtype: int64)]
           

如何繼續保持DataFrame對象,讓其不變成Series對象: 添加as_index=False,指定分組的列不作為index即可。

df.groupby(('key'),as_index=False).sum()

  key  value
0   a     20
1   b     12
2   c     13