天天看點

python簡介以及運作

華科HTTP

使用Python網絡爬蟲首先需要了解一下什麼是HTTP,因為這個跟Python爬蟲的基本原理息息相關。而正是圍繞着這些底層邏輯,Python爬蟲才能一步步地往下進行。

HTTP全稱是Hyper Text Transfer Protocol,中文叫超文本傳輸協定,用于從網絡傳輸超文本資料到本地浏覽器的傳送協定,也是網際網路上應用最為廣泛的一種網絡傳輸協定。

請求與響應

當我們從浏覽器輸入URL回車之後,浏覽器就會向網站所在的伺服器發送一個請求,伺服器收到請求後對其進行解析和處理,然後傳回浏覽器對應的響應,響應裡包含了頁面的源代碼等内容,經過浏覽器的解析之後便呈現出我們在浏覽器上看到的内容。這整個過程就是HTTP的請求與響應。

繼續閱讀