天天看點

HTTP協定學習---(五)壓縮

HTTP壓縮是指: Web伺服器和浏覽器之間壓縮傳輸的”文本内容“的方法。 HTTP采用通用的壓縮算法,比如gzip來壓縮HTML,Javascript, CSS檔案。 能大大減少網絡傳輸的資料量,提高了使用者顯示網頁的速度。當然,同時會增加一點點伺服器的開銷。 本文從HTTP協定的角度,來了解HTTP壓縮這個概念。

閱讀目錄

  1. HTTP内容編碼和HTTP壓縮的差別
  2. HTTP壓縮的過程
  3. 執行個體:用Fiddler觀察HTTP壓縮
  4. 内容編碼類型
  5. 壓縮的好處
  6. gzip的缺點
  7. gzip是如何壓縮的
  8. HTTP Response能壓縮,HTTP Request也是可以壓縮的

HTTP壓縮,在HTTP協定中,其實是内容編碼的一種。

在http協定中,可以對内容(也就是body部分)進行編碼, 可以采用gzip這樣的編碼。 進而達到壓縮的目的。 也可以使用其他的編碼把内容攪亂或加密,以此來防止未授權的第三方看到文檔的内容。

是以我們說HTTP壓縮,其實就是HTTP内容編碼的一種。 是以大家不要把HTTP壓縮和HTTP内容編碼兩個概念混淆了。

1. 浏覽器發送Http request 給Web伺服器,  request 中有Accept-Encoding: gzip, deflate。 (告訴伺服器, 浏覽器支援gzip壓縮)

2. Web伺服器接到request後, 生成原始的Response, 其中有原始的Content-Type和Content-Length。

3. Web伺服器通過Gzip,來對Response進行編碼, 編碼後header中有Content-Type和Content-Length(壓縮後的大小), 并且增加了Content-Encoding:gzip.  然後把Response發送給浏覽器。

4. 浏覽器接到Response後,根據Content-Encoding:gzip來對Response 進行解碼。 擷取到原始response後, 然後顯示出網頁。

如下圖:

HTTP協定學習---(五)壓縮

執行個體:Fiddler觀察HTTP壓縮

眼見為實, 我們看一個實際的例子, 我發現部落格園就使用了gzip壓縮。

使用Fiddler可以清楚地看到。  

HTTP協定學習---(五)壓縮
HTTP協定學習---(五)壓縮

在Fiddler中,每次都要手動去decode. 太麻煩。  點選工具欄上的"Decode"按鈕,就可以自動decode了。

 HTTP定義了一些标準的内容編碼類型,并允許用擴充的形式添加更多的編碼。

Content-Encoding header 就用這些标準化的代号來說明編碼時使用的算法

Content-Encoding值

gzip  表明實體采用GNU zip編碼

compress 表明實體采用Unix的檔案壓縮程式

deflate  表明實體是用zlib的格式壓縮的

identity  表明沒有對實體進行編碼。當沒有Content-Encoding header時, 就預設為這種情況

gzip, compress, 以及deflate編碼都是無損壓縮算法,用于減少傳輸封包的大小,不會導緻資訊損失。 其中gzip通常效率最高, 使用最為廣泛。

 http壓縮對純文字可以壓縮至原内容的40%, 進而節省了60%的資料傳輸。

 執行個體: 部落格園首頁壓縮前是:46124 bytes. 壓縮後是:16368bytes.     隻有原先的35%。  節省了65%的資料傳輸,進而大大提高了性能

 有圖為證。

HTTP協定學習---(五)壓縮
HTTP協定學習---(五)壓縮

Gzip的缺點

JPEG這類檔案用gzip壓縮的不夠好。

Gzip是如何壓縮的

簡單來說, Gzip壓縮是在一個文本檔案中找出類似的字元串, 并臨時替換他們,使整個檔案變小。這種形式的壓縮對Web來說非常适合, 因為HTML和CSS檔案通常包含大量的重複的字元串,例如空格,标簽。

浏覽器是不會對Request壓縮的。 但是 一些HTTP程式在發送Request時,會對其進行編碼。 如下圖。