Python 爬蟲小白入門之爬取網站圖檔

作者：WarAndPeace 2023-04-21 12:55:00

爬蟲知識博大精深，但是入門不難，小白也是可以學會的。相信你看了下面的操作執行個體，一定可以舉一反三，循序漸進，從入門到精通就不遠了。

一、任務

爬取baidu網站的logo圖檔

二、操作執行個體

1、打開圖檔所在網站，這裡打開baidu.com，然後按F12或右鍵點選inspect（檢查/檢視），如下圖：

重新整理網頁：

2、找到所需圖檔，如下圖：

3、點選headers,找到圖檔url并拷貝，如下圖：

你可以把拷貝的url，放到粘貼到浏覽器位址欄，檢視是否是所需圖檔的網址。

三、編寫爬蟲代碼

1、導入requests子產品，如果沒有安裝，可以打開CMD指令行視窗，輸入pip install requests進行安裝。

import requests

2、發送請求

url= 'https://www.baidu.com/img/flexible/logo/pc/[email protected]'

response=requests.get(url)

3、列印響應狀态碼，200為請求成功。

print(response.status_code)

4、儲存響應内容

content=response.content

with open('baiduLogo.png','wb') as f:

f.write(content)

print('success')

運作代碼，如下圖：

快去檢視一下結果吧，如下圖：

繼續閱讀