使用pycharm连接sqlserver数据库保存scrapy的数据

2023-04-13 05:24:51

目前很多使用scrapy框架的程序员将数据保存在MongoDB、MySql数据库，但是很少又将数据保存到SqlServer数据。

但是难免会有企业是使用的sqlserver数据库保存数据，接下来我们就将scrapy爬虫获取的数据保存到sqlserver数据库可能会遇到的一些问题呵方法整理一下。

能看到这篇文章的人，我想scrapy的基本使用已经没什么问题了，我们就只说pipelines这个模块的保存方法。

既然是使用sqlserver数据库，自然需要先安装完成，我使用的是sqlserver2012，微软官网就能直接下载。（假设你已经安装完成）

在实际爬虫项目的环境中，如果是将数据保存到本地的数据库，安装pymssql模块，命令pip install pymssql。

使用pycharm连接sqlserver数据库保存scrapy的数据

没装的装好再继续，我这边已经安装完成。

接下来，我们在pipelines.py模块中写一个保存数据的类

class MsSqlPipelineX(object):
    def __init__(self):
        self.conn = pymssql.connect(host='localhost',user='sa',password='******',database='Find')
        self.cursor = self.conn.cursor()

    def process_item(self,item,spider):
        try:
            # sql = 'INSERT INTO dbo.find(user_name,user_url) VALUES (%s,%s)'
            self.cursor.execute("INSERT INTO dbo.find(user_name,user_url) VALUES (%s,%s)",(item['user_name'],item['user_url']))
            self.conn.commit()
        except Exception as ex:
            print(ex)
        return item

你可以提前在数据库中建好表和字段

host指明数据库是本地

user指明当前的用户名

password指明密码

database指明要存入的数据库，

不用指明端口

如果代码出现黄色警报，

self.cursor.execute("INSERT INTO dbo.find(user_name,user_url) VALUES (%s,%s)",(item['user_name'],item['user_url']))

表示当前编译器中没有指明数据库，也可认为没有正确连接到数据库。

使用pycharm连接sqlserver数据库保存scrapy的数据

以下是解决办法：

点击编译器的Database

使用pycharm连接sqlserver数据库保存scrapy的数据

导入数据库

使用pycharm连接sqlserver数据库保存scrapy的数据

填写红色框中的信息，

Database为sqlserver中建立好的数据库名

取消 use.*?的钩

使用用户名/密码登录数据库

点击ok保存

使用pycharm连接sqlserver数据库保存scrapy的数据

就是这个样子

使用pycharm连接sqlserver数据库保存scrapy的数据

报红，没关系，我们现在看看数据是否能保存入数据库。

使用pycharm连接sqlserver数据库保存scrapy的数据

运行代码，数据正常开始获取。

使用pycharm连接sqlserver数据库保存scrapy的数据

查看数据库的信息

使用pycharm连接sqlserver数据库保存scrapy的数据

可以看到数据已经存到数据库中，说明成功了。

以上，加油吧

使用pycharm连接sqlserver数据库保存scrapy的数据

继续阅读

set define off关闭替代变量功能

报错：'mysql' 不是内部或外部命令，也不是可运行的程序或批处理文件。

Linxu常用命令技巧汇总

ERROR 1 (HY000): Can't create/write to file '/tmp/#sql_4188_1.MYI' (Errcode: 28)

艰难安装LDAP,SSL认证

《Linux命令行与Shell脚本编程大全第2版.布卢姆》pdf

MySQL的4种隔离级别？出现问题

XX系统实施过程问题总结

sort()函数到底是怎样进行数字排序的

无组件上传图片到数据库中，最完整解决方案

【MySQL数据库】数据库索引事务1.索引2.事务

neo4j之cypher使用文档

NOSQL安全攻击

mybatis_入门程序Mybatis入门

登录plsql 报错 the account is locked --用户被锁

SequoiaDB巨杉数据库C++驱动概述