零代碼程式設計：用ChatGPT批量提取網頁上的文本資訊内容

2023-07-17 15:41:00

現在有很多個網頁：

要批量提取網頁内的文本：

可以在ChatGPT中這樣寫提示詞：

你是一個Python專家，寫一段Python程式，完全提取網頁文本内容的任務，下面是一步步的步驟：

打開表格檔案，檔案路徑：F：\傳感器企業大全(傳感器專家網)20230714.xlsx；

擷取表格E2單元格到E3939的單元格的内容，如“/brand/6182.html”，前面加上“https://www.sensorexpert.com.cn”，構成一個URL，注意：從第2行開始讀取；

打開這個URL，Request headers為：

Authority:

http://www.sensorexpert.com.cn

:Method:

GET

:Path:

/brand/6182.html

:Scheme:

https

Accept:

text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7

Accept-Encoding:

gzip, deflate, br

Accept-Language:

zh-CN,zh;q=0.9,en;q=0.8

Cache-Control:

max-age=0

Sec-Ch-Ua:

"Not.A/Brand";v="8", "Chromium";v="114", "Google Chrome";v="114"

Sec-Ch-Ua-Mobile:

Sec-Ch-Ua-Platform:

"Windows"

Sec-Fetch-Dest:

document

Sec-Fetch-Mode:

navigate

Sec-Fetch-Site:

none

Sec-Fetch-User:

Upgrade-Insecure-Requests:

User-Agent:

Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36

定位xpath=/html/body/div[1]/div/div/div[2]/div[3]/div/div[1]/div/div/p[5]/strong 的strong 元素，提取裡面的内容,設為變量:sensortitile,列印輸出；

定位class="content-company"的div元素，使用 xpath('.//text()') 來擷取所有子元素的文本，并使用 join() 方法将它們連接配接在一起，然後使用 strip() 方法進行清理；提取的文本内容設為變量:sensorcompany；

在F盤建立一個Excel：傳感器企業簡介.xlsx，第1列寫入sensortitile，第2列寫入sensorcompany，第3列内容為“傳感器企業大全(傳感器專家網)20230714.xlsx”中的URL；

注意：每一步都要輸出資訊；

如果沒有擷取到strong 元素或div元素内容，就寫入空值；

每爬取1個URL内容，随機暫停3秒以内；

要有應對反爬蟲的措施，比如設定請求頭；

程式運作後的結果：

零代碼程式設計：用ChatGPT批量提取網頁上的文本資訊内容

繼續閱讀

如何組建測試團隊？（原創）

Tensorflow 代碼問題彙總

設計在鍊式存儲結構上交換二叉樹中所有結點左右子樹的算法

零代碼程式設計：用ChatGPT批量提取錄音稿中某人的全部文本

行業毒瘤還是長久需求？無代碼程式設計會是趨勢嗎？

2023蘋果全球開發者大會正在進行中，目前已陸續釋出了新款15英寸MacBookAir，MacPro，MacStudio

工具腳本作業開發代碼程式設計考試快來。#python#python程式設計#python代寫#python爬蟲#python腳本

用python實作身份證号的解析，輸出性别，生日，生肖，星座用python實作身份證号的解析，輸出性别，生日，生肖，星

OpenFOAM背景運作程式以及nohup指令

短信群發的獲客效果如何？短信群發的獲客效果取決于多個因素，包括目标閱聽人、短信内容發送頻率和營銷政策等。以下是影響短信群發

零代碼程式設計：用ChatGPT自動登陸微信公衆号背景

iPhone16ProMax有望配備“超級遠攝”潛望鏡變焦攝像頭.盡管iPhone15系列還未釋出，但關于iPhone1

短信群發營銷優缺點有哪些？短信群發是一種常用的推廣方式，許多商家和企業利用它來吸引潛在客戶的注意。然而，這種方式也有其優

讓貴人主動幫助你。霞姐的語音。為什麼别人不幫你呢？因為你太沒有心機了，不懂人性就會處處受傷。我來教你如何讓别人主動幫助你

《阿凡達》系列電影的出現使得以3D為代表的一系列影像技術走進了大衆視野，同時将環保電影技術與藝術的融合表達推向了一個全新

趙雪柔趕緊在晚上釋出了一條暗示性很強的朋友圈：能不能抓緊我？并配上一張自己在晚風長椅上側坐的照片。沒過多久，她的消息提示