使用xpath來爬一點點小東西

2023-03-11 12:16:40

使用的是xpath來爬的

1.先找一個很簡單網站來練習的練習

Python代碼：

運作的環境是windows下，用的是pycharm3.5

主要需要安裝的是lxml和requests,Windows下直接

pip install requests

安裝lxml，見連結：

http://blog.csdn.net/qq1815145797/article/details/78394363

import requests
from lxml import etree

headers_base={
'User-Agent': 'Fiddler/4.6.20171.26113 (.NET 4.5.2; WinNT 6.1.7601 SP1; zh-CN; 4xAMD64; Auto Update; Full Instance; Extensions: APITesting, AutoSaveExt, EventLog, Geoedge, HostsFile, RulesTab2, SAZClipboardFactory, SimpleFilter, Timeline)'
}

response=requests.get('https://www.zhihu.com/search?type=content&q=python',headers=headers_base)

html=etree.HTML(response.text)
spider_zhihu=html.xpath("//div/a[@target='_blank']/text() | //div/span/a[@class='author author-link']/text() | //div/span/a/span/text()")

for sp in spider_zhihu:
    print(sp)

運作的結果部分圖：

使用xpath來爬一點點小東西

總結

不足之處：

1.現在我隻是将它列印pycharm的終端了，接下來看書的時候可以再将其抓取到檔案中，
2.隻是抓取了一頁的内容

使用xpath來爬一點點小東西

使用的是xpath來爬的

總結

繼續閱讀

v2ex的簡單爬蟲

Python漫畫爬蟲開源 66漫畫 AJAX，包含資料庫連接配接，圖檔下載下傳處理

requests子產品進行人人網模拟登陸

Python image.show() 出錯FSPathMakeRef(/Applications/Preview.app) failed with error -43

2023爬蟲學習筆記 -- 多線程操作

M團店鋪評價采集不到問題問題展示：解決方案：

Python爬蟲學習（1）

Python爬蟲學習進階

Python爬蟲（入門+進階）學習筆記 1-2 初識Python爬蟲

Python進階爬蟲——Class1：認識爬蟲

python爬蟲學習筆記-1

python學習之urllib使用小結

NOIp模拟題之肮髒的牧師（桶排序）

一篇文章教你如何在一個月内學會爬取大規模資料

Pyhton爬蟲實戰 - 抓取BOSS直聘職位描述和資料清洗Pyhton爬蟲實戰 - 抓取BOSS直聘職位描述和資料清洗

sort()函數到底是怎樣進行數字排序的