天天看点

DC学院爬虫学习笔记(五):使用pandas保存豆瓣短评数据保存数据的方法:使用pandas保存数据实战

open函数保存

pandas包保存(本节课重点讲授)

csv模块保存

numpy包保存

使用with open()新建对象

写入数据

可以使用以下方法得到当前工作目录或者修改当前工作目录

DC学院爬虫学习笔记(五):使用pandas保存豆瓣短评数据保存数据的方法:使用pandas保存数据实战

numpy: (Numerical Python的简称),是高性能科学计算和数据分析的基础包

pandas:基于Numpy创建的Python包,含有使数据分析工作变得更加简单的高级数据结构和操作工具

matplotlib:是一个用于创建出版质量图表的绘图包(主要是2D方面)

常见的导入方法:

导入相关的库

将爬取到的数据储存为DataFrame对象(DataFrame 是一个表格或者类似二维数组的结构,它的各行表示一个实例,各列表示一个变量)

to_excel() 实例方法:用于将DataFrame保存到Excel

read_excel() 方法:从excel文件中读取数据

将数据储存为DataFrame对象

保存数据到csv文件

爬取《小王子》豆瓣短评的数据,并把数据保存为本地的excel表格

爬取《小王子》豆瓣短评前5页的短评数据