爬蟲知識博大精深,但是入門不難,小白也是可以學會的。相信你看了下面的操作執行個體,一定可以舉一反三,循序漸進,從入門到精通就不遠了。
一、任務
爬取baidu網站的logo圖檔
二、操作執行個體
1、打開圖檔所在網站,這裡打開baidu.com,然後按F12或右鍵點選inspect(檢查/檢視),如下圖:
重新整理網頁:
2、找到所需圖檔,如下圖:
3、點選headers,找到圖檔url并拷貝,如下圖:
你可以把拷貝的url,放到粘貼到浏覽器位址欄,檢視是否是所需圖檔的網址。
三、編寫爬蟲代碼
1、導入requests子產品,如果沒有安裝,可以打開CMD指令行視窗,輸入pip install requests進行安裝。
import requests
2、發送請求
url= 'https://www.baidu.com/img/flexible/logo/pc/[email protected]'
response=requests.get(url)
3、列印響應狀态碼,200為請求成功。
print(response.status_code)
4、儲存響應内容
content=response.content
with open('baiduLogo.png','wb') as f:
f.write(content)
print('success')
運作代碼,如下圖:
快去檢視一下結果吧,如下圖: