1 前言
最近看了一些同學的面經,發現無論什麼技術崗位,還是會問到 get 和 post 的差別,而搜尋出來的答案并不能讓我們裝得一手好逼,那就讓我們從 HTTP 封包的角度來撸一波,進而搞明白他們的差別。
2 标準答案
在開撸之前嗎,讓我們先看一下标準答案長什麼樣子 w3school: GET 對比 POST。标準答案很美好,但是在面試的時候把下面的表格甩面試官一臉,估計會裝逼不成反被*。
分類 | GET | POST |
---|---|---|
後退按鈕/重新整理 | 無害 | 資料會被重新送出(浏覽器應該告知使用者資料會被重新送出)。 |
書簽 | 可收藏為書簽 | 不可收藏為書簽 |
緩存 | 能被緩存 | 不能緩存 |
編碼類型 | application/x-www-form-urlencoded | application/x-www-form-urlencoded 或 multipart/form-data。為二進制資料使用多重編碼。 |
曆史 | 參數保留在浏覽器曆史中。 | 參數不會儲存在浏覽器曆史中。 |
對資料長度的限制 | 是的。當發送資料時,GET 方法向 URL 添加資料;URL 的長度是受限制的(URL 的最大長度是 2048 個字元)。 | 無限制。 |
對資料類型的限制 | 隻允許 ASCII 字元。 | 沒有限制。也允許二進制資料。 |
安全性 | 與 POST 相比,GET 的安全性較差,因為所發送的資料是 URL 的一部分。在發送密碼或其他敏感資訊時絕不要使用 GET ! | POST 比 GET 更安全,因為參數不會被儲存在浏覽器曆史或 web 伺服器日志中。 |
可見性 | 資料在 URL 中對所有人都是可見的。 | 資料不會顯示在 URL 中。 |
注意,并不是說标準答案有誤,上述差別在大部分浏覽器上是存在的,因為這些浏覽器實作了 HTTP 标準。
是以從标準上來看,GET 和 POST 的差別如下:
- GET 用于擷取資訊,是無副作用的,是幂等的,且可緩存
- POST 用于修改伺服器上的資料,有副作用,非幂等,不可緩存
但是,既然本文從封包角度來說,那就先不讨論 RFC 上的差別,單純從資料角度談談。
3 GET 和 POST 封包上的差別
先下結論,GET 和 POST 方法沒有實質差別,隻是封包格式不同。
GET 和 POST 隻是 HTTP 協定中兩種請求方式,而 HTTP 協定是基于 TCP/IP 的應用層協定,無論 GET 還是 POST,用的都是同一個傳輸層協定,是以在傳輸上,沒有差別。
封包格式上,不帶參數時,最大差別就是第一行方法名不同
POST方法請求封包第一行是這樣的
POST /uri HTTP/1.1 \r\n
GET方法請求封包第一行是這樣的
GET /uri HTTP/1.1 \r\n
是的,不帶參數時他們的差別就僅僅是封包的前幾個字元不同而已
帶參數時封包的差別呢? 在約定中,GET 方法的參數應該放在 url 中,POST 方法參數應該放在 body 中
舉個例子,如果參數是 name=qiming.c, age=22。
GET 方法簡約版封包是這樣的
GET /index.php?name=qiming.c&age=22 HTTP/1.1
Host: localhost
POST 方法簡約版封包是這樣的
POST /index.php HTTP/1.1
Host: localhost
Content-Type: application/x-www-form-urlencoded
name=qiming.c&age=22
現在我們知道了兩種方法本質上是 TCP 連接配接,沒有差别,也就是說,如果我不按規範來也是可以的。我們可以在 URL 上寫參數,然後方法使用 POST;也可以在 Body 寫參數,然後方法使用 GET。當然,這需要服務端支援。
4. 常見問題
GET 方法參數寫法是固定的嗎?
在約定中,我們的參數是寫在
?
後面,用
&
分割。
我們知道,解析封包的過程是通過擷取 TCP 資料,用正則等工具從資料中擷取 Header 和 Body,進而提取參數。
也就是說,我們可以自己約定參數的寫法,隻要服務端能夠解釋出來就行,一種比較流行的寫法是
http://www.example.com/user/name/chengqm/age/22
。
POST 方法比 GET 方法安全?
按照網上大部分文章的解釋,POST 比 GET 安全,因為資料在位址欄上不可見。
然而,從傳輸的角度來說,他們都是不安全的,因為 HTTP 在網絡上是明文傳輸的,隻要在網絡節點上捉包,就能完整地擷取資料封包。
要想安全傳輸,就隻有加密,也就是 HTTPS。
GET 方法的長度限制是怎麼回事?
在網上看到很多關于兩者差別的文章都有這一條,提到浏覽器位址欄輸入的參數是有限的。
首先說明一點,HTTP 協定沒有 Body 和 URL 的長度限制,對 URL 限制的大多是浏覽器和伺服器的原因。
浏覽器原因就不說了,伺服器是因為處理長 URL 要消耗比較多的資源,為了性能和安全(防止惡意構造長 URL 來攻擊)考慮,會給 URL 長度加限制。
POST 方法會産生兩個TCP資料包?
有些文章中提到,post 會将 header 和 body 分開發送,先發送 header,服務端傳回 100 狀态碼再發送 body。
HTTP 協定中沒有明确說明 POST 會産生兩個 TCP 資料包,而且實際測試(Chrome)發現,header 和 body 不會分開發送。
是以,header 和 body 分開發送是部分浏覽器或架構的請求方法,不屬于 post 必然行為。