豆瓣出版社爬取

2023-07-03 06:27:56

最近在看視訊學習時提到的爬取豆瓣出版社的一個訓練，代碼如下：

注意點：decode使用

import urllib.request
import re
url="https://read.douban.com/provider/all"
data=urllib.request.urlopen(url).read().decode("utf-8")
pat1='<div class="name">(.*?)</div>'
result=re.compile(pat1).findall(data)
context=(",".join([*result]))
outfile="publishing_house.csv"
afile=open(outfile,"w+")
afile.write("Press"+"\n")
afile.write(context.replace(",","\n"))
afile.close()

輸出檔案内容如下：

豆瓣出版社爬取

豆瓣出版社爬取

繼續閱讀

來自python的【條件控制/語句循環/break/continue/else/pass】一、條件控制二、語句循環

無法解析的外部符号 wmain，該符号在函數 "void cdecl mainCRTStartupHelper(struct HINSTANCE *,unsigned short con......

TestLink導出用例轉換工具(XML2Excel)

YAML簡介和PyYAML安全操作YAML支援的類型YAML的優點：yaml的基本文法python操作

Small tricks

libsvm for python 安裝

學習軟體測試基礎測試第七天

Zeppelin 配置通路 REST APIApache Zeppelin Configuration REST API

【Torch】最簡潔logging使用指南

27. Remove Element(清單)題目代碼

Cloud Studio初體驗

使用 ctypes 進行 Python 和 C 的混合程式設計

【python】【資料處理】畫多元資料分布圖

【python】netconf協定對接管理裝置

「Python 網絡自動化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 網絡裝置

在python中建立excel并寫入