天天看點

Python 爬蟲小白入門之爬取網站圖檔

作者:WarAndPeace

爬蟲知識博大精深,但是入門不難,小白也是可以學會的。相信你看了下面的操作執行個體,一定可以舉一反三,循序漸進,從入門到精通就不遠了。

一、任務

爬取baidu網站的logo圖檔

Python 爬蟲小白入門之爬取網站圖檔

二、操作執行個體

1、打開圖檔所在網站,這裡打開baidu.com,然後按F12或右鍵點選inspect(檢查/檢視),如下圖:

Python 爬蟲小白入門之爬取網站圖檔

重新整理網頁:

Python 爬蟲小白入門之爬取網站圖檔

2、找到所需圖檔,如下圖:

Python 爬蟲小白入門之爬取網站圖檔

3、點選headers,找到圖檔url并拷貝,如下圖:

Python 爬蟲小白入門之爬取網站圖檔

你可以把拷貝的url,放到粘貼到浏覽器位址欄,檢視是否是所需圖檔的網址。

三、編寫爬蟲代碼

1、導入requests子產品,如果沒有安裝,可以打開CMD指令行視窗,輸入pip install requests進行安裝。

import requests

2、發送請求

url= 'https://www.baidu.com/img/flexible/logo/pc/[email protected]'

response=requests.get(url)

3、列印響應狀态碼,200為請求成功。

print(response.status_code)

4、儲存響應内容

content=response.content

with open('baiduLogo.png','wb') as f:

f.write(content)

print('success')

運作代碼,如下圖:

Python 爬蟲小白入門之爬取網站圖檔

快去檢視一下結果吧,如下圖:

Python 爬蟲小白入門之爬取網站圖檔