天天看點

爬蟲入門之Http協定

先上HTTP通信圖:

爬蟲入門之Http協定

TCP通信—>HTTP協定通信

HTTP協定(超文本傳輸協定) 應用層協定

  • 用途:
    • 網頁的擷取
    • 資料的傳輸
  • 特點:
    1. 應用層協定,傳輸層采用TCP方式收發消息
    2. 簡單,靈活,很多語言都有http協定接口
    3. 無狀态的協定,協定本身不要求記錄傳輸資料
    4. http1.1 支援持久連接配接
  • 網頁請求過程:
    1. 用戶端通過tcp傳輸發送http請求給伺服器
    2. 伺服器收到Http請求,進行解析
    3. 服務端處理具體請求内容 ,整理需要的資料
    4. 将資料以http相應格式回發給用戶端
    5. 浏覽器接受響應,顯示内容
  1. http請求(request)
    1. 請求格式:
      • 請求行:具體的請求類别和請求内容

        格式: Get / http/1.1

        請求類别 請求内容 協定版本

        請求類别:每種類别代表不同僚情

        GET(擷取網絡資源) POST(送出一定的資訊) HEAD(擷取網絡資源的響應頭) PUT(更新伺服器資源) DELETE(删除伺服器資源) CONNECT TRACE OPTIONS(擷取伺服器資訊)

      • 請求頭:對請求内容的基本描述
      • 空行:
      • 請求體:請求參數和送出内容
  2. HTTP 響應
    1. 響應格式:
      • 響應行:回報相應的基本情況
        • 格式:HTTP/1.1 200 OK

          協定版本 響應嗎 附加資訊

          響應碼:1 提示資訊請求被接收

          2: 響應成功

          3:響應需要進一步操作 重定向

          4:用戶端錯誤

          5:伺服器錯誤

      • 響應頭:對相應内容的描述資訊
      • 空行
      • 響應體 :回複給用戶端的具體内容

繼續閱讀