常用庫
- requests
- beautifulsoup bs4
-
requests-html
接觸過爬蟲用的最多的包無非就是requests, urllib包,我們再使用這些包的時候顯示,用requests包去擷取響應,然後再利用pyquery或者bs4,xpath再去整理提取我們需要是目标資料。也就是下面兩步:
import requests
from pyquery import PyQuery as pq
#擷取網頁
html = requests.get()
#解析網頁
doc = pq(html)
作者:RevinDuan
連結:https://www.jianshu.com/p/bd828b9cf74d
來源:簡書
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請注明出處。