天天看點

pandas的一些基本操作(my pandas cook book)前言總結

前言

本人實習中經常遇到一些資料分析的任務,大多是用pandas完成的,是以在這裡簡單做個總結。

PS:

面向的是已對pandas有基本了解,想要快速查找或回顧的讀者。

有些重要的用法已經加上超連結,都是精選的優秀總結(輪子咱們就不重複造了)。

用法 文法
讀取

pd.read_csv()、pd.read_sql

、…
建立Dataframe 從字典建立:

df = pd.DataFrame({'column_name1': list1, 'column_name2': list2})

從二維數組建立:

data = [[0 , 'sam', 100], [1, 'tony', 98], [2, 'sherry', 99] ]

df = pd.DataFdatarame(data, columns = ['id', 'name', 'score'])

拼接

pd.concat([df1, df2])

pd.merge(df1, df2)

篩選、排序 篩選:

df.loc[ (condition1) & (condition2) ]

*condition條件取反就是(~condition)

排序:df.sort()

分組

df.groupby()

逐行逐列操作

df.apply()

去重

df.drop_duplicates(subset=None, keep='first', inplace=Flase)

判斷 是否為空 :

df.isnull()

df.isnull().any()

是否重複:

df.duplicated(subset=None, keep=‘first’)

是否在集合裡面:

df.isin(list)

重命名

df.rename(columns={'old_name': 'new_name'})

統計

df.valule_counts()

df.mean()

畫圖

df.plot()

df.hist()

總結

最好掌握的方法就是上手去試,最好的記憶方法就是重複,多做~

繼續閱讀