boren - 学习用python爬取脑经急转弯

2023-07-22 13:45:01

import requests
import re
for yema in range(1,75):
    print("正在爬取第%d页"%yema)
    wangzhi ="http://www.2345.com/inner/jzw/%d.htm"%yema
    response = requests.get(wangzhi)
    # print(response.text)
    # .可以替代任意一个字符
    # * 指前面这个字符可以出现多次
    r =re.findall('<li><span class="table_left">(.*)</span>',response.text)
    f = open('text','a')
    for i in r:
        try:
            i = i.split('</span><span class="table_right"><a href="javascript:;" target="_blank" rel="external nofollow"  class="answer" οnclick="MM_popupMsg(')
            # print(i[0])
            f.write(i[0])
            f.write('\n')
            # print(i[1])
        except:
            continue  # 继续 跳出当前循环，进行下一次循环
    f.close()

# 匹配术：正则表达式
# re
s = """
nbvenkghmd ,fv,kgm x,dtr5foguhijhugyfgvhbjnkljhkgjhvbjjbcgfxvhbjkhvgchvbjknhvgcvhbjkhvghbjnkbhvg njbhvgbjSDTRFGJBHKNLKJHGVBJNKML;NBHVGCVHBJNKLJXFCGVHBJNKL;VFCGVHJKLHUGYFTCGVHBJHKGHCHBJKNJHVGB000000000152154@#$%^&*u(p)(trcgvhbfdxfcgASDADSASDDDD45/AD4./ADA4,4TS5RS.RASF2CZ46R87Z4knhv njkbhvjnkbhvbjn
"""
# f,g R F B @
import re
# # r = re.findall('f[a-z]g',s) # findall 发现所有
# # r = re.findall('r[0-9]f',s) # findall 发现所有
# #r = re.findall('B([0-9]*)@',s) # findall 发现所有
# r =re.findall("fdxfcg(.*)k",s)
# print(r)

# a = '大吉大利？几万吃鸡'
# a = a.split('？')
# print(a[0])

for i in range(10):
    if i == 5:
        continue
    print(i)

boren - 学习用python爬取脑经急转弯

继续阅读

来自python的【条件控制/语句循环/break/continue/else/pass】一、条件控制二、语句循环

无法解析的外部符号 wmain，该符号在函数 "void cdecl mainCRTStartupHelper(struct HINSTANCE *,unsigned short con......

TestLink导出用例转换工具(XML2Excel)

YAML简介和PyYAML安全操作YAML支持的类型YAML的优点：yaml的基本语法python操作

Small tricks

libsvm for python 安装

学习软件测试基础测试第七天

Zeppelin 配置访问 REST APIApache Zeppelin Configuration REST API

【Torch】最简洁logging使用指南

27. Remove Element(列表)题目代码

Cloud Studio初体验

使用 ctypes 进行 Python 和 C 的混合编程

【python】【数据处理】画多维数据分布图

【python】netconf协议对接管理设备

「Python 网络自动化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 网络设备

在python中创建excel并写入