天天看点

pandas的一些基本操作(my pandas cook book)前言总结

前言

本人实习中经常遇到一些数据分析的任务,大多是用pandas完成的,所以在这里简单做个总结。

PS:

面向的是已对pandas有基本了解,想要快速查找或回顾的读者。

有些重要的用法已经加上超链接,都是精选的优秀总结(轮子咱们就不重复造了)。

用法 语法
读取

pd.read_csv()、pd.read_sql

、…
新建Dataframe 从字典创建:

df = pd.DataFrame({'column_name1': list1, 'column_name2': list2})

从二维数组创建:

data = [[0 , 'sam', 100], [1, 'tony', 98], [2, 'sherry', 99] ]

df = pd.DataFdatarame(data, columns = ['id', 'name', 'score'])

拼接

pd.concat([df1, df2])

pd.merge(df1, df2)

筛选、排序 筛选:

df.loc[ (condition1) & (condition2) ]

*condition条件取反就是(~condition)

排序:df.sort()

分组

df.groupby()

逐行逐列操作

df.apply()

去重

df.drop_duplicates(subset=None, keep='first', inplace=Flase)

判断 是否为空 :

df.isnull()

df.isnull().any()

是否重复:

df.duplicated(subset=None, keep=‘first’)

是否在集合里面:

df.isin(list)

重命名

df.rename(columns={'old_name': 'new_name'})

统计

df.valule_counts()

df.mean()

画图

df.plot()

df.hist()

总结

最好掌握的方法就是上手去试,最好的记忆方法就是重复,多做~

继续阅读