python网页爬虫通用代码示例

2022-11-18 13:46:12

import requests
#import time

def getHTMLText(url):
    try:
        r = requests.get(url,timeout = 30)
        r.raise_for_status()#如果状态不是200，产生HTTPError异常
        #print(r.status_code)
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return "产生异常"

if __name__ == '__main__':
    url = "http://www.baidu.com"
    print(getHTMLText(url))

html Python爬虫通用模板网页爬虫

上一篇: android 与服务器之间的推送方式

下一篇: python单线程爬虫安装与调试

继续阅读

HTML addEventListener() 方法和attachEvent()区别分析
html javascript
08-07
Boss直聘Python爬虫实战
Python python编程 Python爬虫网络爬虫编程语言
08-07
web前端布局练手项目
工程师的素养--前端 css html web
08-07
Django之验证码（十七）验证码
html django
08-07
Vue项目 - 单文件组件和Vue中的路由
vue.js 前端 webpack html javascript
11-09
龙珠训练营task04
html sql html5
08-07
赶工心得（一）
胡诌八扯&想法工作 html 编程 css web
08-07
一个小小的移动web版音乐播放器
小尝试 html
08-07
Docker - Dockerfile之ADD、COPY、WORKDIR、USER、EXPOSE指令详解
Docker Linux centos 目标路径 html
11-09
Compile workrave under windows &ndash; My exprience 在Windows上编译Workrave
C/C++ Linux Windows download reference include macros html
08-07
门户通专访草根站长九天狼：做站贵在坚持
一滴水的站长访谈数据库工作 html 搜索引擎百度工具
08-07
tabpanel 使用问题
javascript EXT fp css html ViewUI
08-07
为什么把CSS放头部，script放下面
# 面试笔记（一）【html和浏览器】篇 html
08-07
CSS之折叠菜单
前端 css html
08-07
web开发之前后端渲染
前端 react 模板引擎渲染 html
08-07
403 Forbidden，You don't have permission to access / on this server.Forbidden
html
08-07