python爬虫超简单实例

2023-05-30 00:52:11

import requests #导入必备神器requests
import re #导入正则

url='http://www.jjwxc.net/onebook.php?novelid=109034&chapterid=1' 
response=requests.get(url)
response.encoding='gb2312'#根据要爬的网页的编码进行编码
html=response.text #转换成文本

info=re.findall(r'<div style="clear:both;"></div>([\s\S]*)<div id="favoriteshow_3" style="display:none" align="center"></div>',html)[0]
#使用正则进行匹配小说内容

print(info)#打印

笔记爬虫简单小说

上一篇: python 对user_agent进行解析

下一篇: python闭包变量_python闭包，在内部函数内部赋给外部变量

继续阅读

天池龙珠金融风控训练营Task04学习笔记前言学习知识点概要学习内容学习问题与解答学习思考与总结
笔记机器学习
08-07
2021-09-301、Ubuntu18.04安装Google浏览器2、待定
笔记 ubuntu
08-07
（Nginx）03_Nginx原理与优化一、Nginx原理二、master-workers机制三、面试题：
nginx 笔记
08-07
（Nginx）02_Nginx配置实例一、Nginx的应用：反向代理实现一：二、反向代理实例二：三、Nginx的配置实例三–负载均衡：四、Nginx的配置实例四–动静分离：Nginx在实际开发中的应用：
nginx 笔记
08-07
nginx配置示例
笔记 nginx
08-07
2022秋招面试记录与反思
笔记
08-07
《断舍离》读后感
笔记
08-07
unity中实现背景滚动
笔记 Unity c#
08-07
命令行和环境变量
笔记 Python java
08-07
Android记事本（附apk和源码）
笔记安卓
08-07
现国内基金定投最好的入门书《指数基金投资指南》
基金笔记投资基础
08-07
【人工智能行业大师访谈1】吴恩达采访 Geoffery Hinton
吴恩达深度学习笔记笔记 AI Python 深度学习机器学习人工智能生成对抗网络
08-07
线程同步，可重入锁，synchronized
笔记线程安全多线程
08-07
对象锁和全局锁
笔记
08-07
sort()函数到底是怎样进行数字排序的
爬虫
08-07
iview后台管理模版
笔记
08-07