天天看點

HTTP緩存機制和原理

在介紹HTTP緩存之前,作為知識鋪墊,先簡單介紹一下HTTP封包

HTTP封包就是浏覽器和伺服器間通信時發送及響應的資料塊。

浏覽器向伺服器請求資料,發送請求(request)封包;伺服器向浏覽器傳回資料,傳回響應(response)封包。

封包資訊主要分為兩部分

1.包含屬性的首部(header)--------------------------附加資訊(cookie,緩存資訊等)與緩存相關的規則資訊,均包含在header中

2.包含資料的主體部分(body)-----------------------HTTP請求真正想要傳輸的部分

緩存規則解析

為友善大家了解,我們認為浏覽器存在一個緩存資料庫,用于存儲緩存資訊。

在用戶端第一次請求資料時,此時緩存資料庫中沒有對應的緩存資料,需要請求伺服器,伺服器傳回後,将資料存儲至緩存資料庫中。

HTTP緩存機制和原理

HTTP緩存有多種規則,根據是否需要重新向伺服器發起請求來分類,将其分為兩大類(強制緩存,對比緩存)

在詳細介紹這兩種規則之前,先通過時序圖的方式,讓大家對這兩種規則有個簡單了解。

已存在緩存資料時,僅基于強制緩存,請求資料的流程如下:

HTTP緩存機制和原理

已存在緩存資料時,僅基于對比緩存,請求資料的流程如下:

HTTP緩存機制和原理

對緩存機制不太了解的同學可能會問,基于對比緩存的流程下,不管是否使用緩存,都需要向伺服器發送請求,那麼還用緩存幹什麼?這個問題,我們暫且放下,後文在詳細介紹每種緩存規則的時候,會帶給大家答案。

我們可以看到兩類緩存規則的不同,強制緩存如果生效,不需要再和伺服器發生互動,而對比緩存不管是否生效,都需要與服務端發生互動。

兩類緩存規則可以同時存在,強制緩存優先級高于對比緩存,也就是說,當執行強制緩存的規則時,如果緩存生效,直接使用緩存,不再執行對比緩存規則。

強制緩存

從上文我們得知,強制緩存,在緩存資料未失效的情況下,可以直接使用緩存資料,那麼浏覽器是如何判斷緩存資料是否失效呢?

我們知道,在沒有緩存資料的時候,浏覽器向伺服器請求資料時,伺服器會将資料和緩存規則一并傳回,緩存規則資訊包含在響應header中。

對于強制緩存來說,響應header中會有兩個字段來标明失效規則(Expires/Cache-Control)

使用chrome的開發者工具,可以很明顯的看到對于強制緩存生效時,網絡請求的情況

HTTP緩存機制和原理

Expires

  Expires的值為服務端傳回的到期時間,即下一次請求時,請求時間小于服務端傳回的到期時間,直接使用緩存資料。

不過Expires 是HTTP 1.0的東西,現在預設浏覽器均預設使用HTTP 1.1,是以它的作用基本忽略。

另一個問題是,到期時間是由服務端生成的,但是用戶端時間可能跟服務端時間有誤差,這就會導緻緩存命中的誤差。

是以HTTP 1.1 的版本,使用Cache-Control替代。

Cache-Control

Cache-Control 是最重要的規則。常見的取值有private、public、no-cache、max-age,no-store,預設為private。

private: 用戶端可以緩存

public: 用戶端和代理伺服器都可緩存(前端的同學,可以認為public和private是一樣的)

max-age=xxx: 緩存的内容将在 xxx 秒後失效

no-cache: 需要使用對比緩存來驗證緩存資料(後面介紹)

no-store: 所有内容都不會緩存,強制緩存,對比緩存都不會觸發(對于前端開發來說,緩存越多越好,so…基本上和它說886)

HTTP緩存機制和原理
HTTP緩存機制和原理

圖中Cache-Control僅指定了max-age,是以預設為private,緩存時間為31536000秒(365天)

也就是說,在365天内再次請求這條資料,都會直接擷取緩存資料庫中的資料,直接使用。

對比緩存

對比緩存,顧名思義,需要進行比較判斷是否可以使用緩存。

浏覽器第一次請求資料時,伺服器會将緩存辨別與資料一起傳回給用戶端,用戶端将二者備份至緩存資料庫中。

再次請求資料時,用戶端将備份的緩存辨別發送給伺服器,伺服器根據緩存辨別進行判斷,判斷成功後,傳回304狀态碼,通知用戶端比較成功,可以使用緩存資料。

第一次通路:

HTTP緩存機制和原理

再次通路:

HTTP緩存機制和原理

通過兩圖的對比,我們可以很清楚的發現,在對比緩存生效時,狀态碼為304,并且封包大小和請求時間大大減少。

原因是,服務端在進行辨別比較後,隻傳回header部分,通過狀态碼通知用戶端使用緩存,不再需要将封包主體部分傳回給用戶端。PS:上面問題的答案在此

對于對比緩存來說,緩存辨別的傳遞是我們着重需要了解的,它在請求header和響應header間進行傳遞,

一共分為兩種辨別傳遞,接下來,我們分開介紹。

Last-Modified / If-Modified-Since

Last-Modified: 伺服器在響應請求時,告訴浏覽器資源的最後修改時間。
HTTP緩存機制和原理

If-Modified-Since: 再次請求伺服器時,通過此字段通知伺服器上次請求時,伺服器傳回的資源最後修改時間。 伺服器收到請求後發現有頭If-Modified-Since 則與被請求資源的最後修改時間進行比對。

若資源的最後修改時間大于If-Modified-Since,說明資源又被改動過,則響應整片資源内容,傳回狀态碼200;

若資源的最後修改時間小于或等于If-Modified-Since,說明資源無新修改,則響應HTTP304,告知浏覽器繼續使用所儲存的cache。

HTTP緩存機制和原理

Etag / If-None-Match(優先級高于Last-Modified / If-Modified-Since)

Etag: 伺服器響應請求時,告訴浏覽器目前資源在伺服器的唯一辨別(生成規則由伺服器決定)。
HTTP緩存機制和原理

If-None-Match: 再次請求伺服器時,通過此字段通知伺服器客戶段緩存資料的唯一辨別。

伺服器收到請求後發現有頭If-None-Match 則與被請求資源的唯一辨別進行比對,

不同,說明資源又被改動過,則響應整片資源内容,傳回狀态碼200; 相同,說明資源無新修改,則響應HTTP

304,告知浏覽器繼續使用所儲存的cache。

HTTP緩存機制和原理

總結

對于強制緩存,伺服器通知浏覽器一個緩存時間,在緩存時間内,下次請求,直接用緩存,不在時間内,執行比較緩存政策。

對于比較緩存,将緩存資訊中的Etag和Last-Modified通過請求發送給伺服器,由伺服器校驗,傳回304狀态碼時,浏覽器直接使用緩存。

HTTP緩存機制和原理
HTTP緩存機制和原理

原文連結:http://www.cnblogs.com/chenqf/p/6386163.html

繼續閱讀