我們知道HTTP協定采用“請求-應答”模式,當使用普通模式,即非KeepAlive模式時,每個請求/應答客戶和伺服器都要建立一個連接配接,完成之後立即斷開連接配接(HTTP協定為無連接配接的協定);當使用Keep-Alive模式(又稱持久連接配接、連接配接重用)時,Keep-Alive功能使用戶端到伺服器端的連接配接持續有效,當出現對伺服器的後繼請求時,Keep-Alive功能避免了建立或者重建立立連接配接。
http 1.0中預設是關閉的,需要在http頭加入"Connection: Keep-Alive",才能啟用Keep-Alive;http 1.1中預設啟用Keep-Alive,如果加入"Connection: close ",才關閉。目前大部分浏覽器都是用http1.1協定,也就是說預設都會發起Keep-Alive的連接配接請求了,是以是否能完成一個完整的Keep- Alive連接配接就看伺服器設定情況。
By opening and closing fewer TCP connections, CPU time is saved in routers and hosts (clients, servers, proxies, gateways, tunnels, or caches), and memory used for TCP protocol control blocks can be saved in hosts.
HTTP requests and responses can be pipelined on a connection. Pipelining allows a client to make multiple requests without waiting for each response, allowing a single TCP connection to be used much more efficiently, with much
lower elapsed time.
Network congestion is reduced by reducing the number of packets caused by TCP opens, and by allowing TCP sufficient time to determine the congestion state of the network.
Latency on subsequent requests is reduced since there is no time spent in TCP's connection opening handshake.
HTTP can evolve more gracefully, since errors can be reported without the penalty of closing the TCP connection. Clients using future versions of HTTP might optimistically try a new feature, but if communicating with an older
server, retry with old semantics after an error is reported.
Keep-Alive模式,用戶端如何判斷請求所得到的響應資料已經接收完成(或者說如何知道伺服器已經發生完了資料)?我們已經知道了,Keep-Alive模式發送玩資料HTTP伺服器不會自動斷開連接配接,所有不能再使用傳回EOF(-1)來判斷(當然你一定要這樣使用也沒有辦法,可以想象那效率是何等的低)!下面我介紹兩種來判斷方法。
故名思意,Conent-Length表示實體内容長度,用戶端(伺服器)可以根據這個值來判斷資料是否接收完成。但是如果消息中沒有Conent-Length,那該如何來判斷呢?又在什麼情況下會沒有Conent-Length呢?請繼續往下看……
當用戶端向伺服器請求一個靜态頁面或者一張圖檔時,伺服器可以很清楚的知道内容大小,然後通過Content-length消息首部字段告訴用戶端需要接收多少資料。但是如果是動态頁面等時,伺服器是不可能預先知道内容大小,這時就可以使用Transfer-Encoding:chunk模式來傳輸資料了。即如果要一邊産生資料,一邊發給用戶端,伺服器就需要使用"Transfer-Encoding: chunked"這樣的方式來代替Content-Length。
chunk編碼将資料分成一塊一塊的發生。Chunked編碼将使用若幹個Chunk串連而成,由一個标明長度為0 的chunk标示結束。每個Chunk分為頭部和正文兩部分,頭部内容指定正文的字元總數(十六進制的數字 )和數量機關(一般不寫),正文部分就是指定長度的實際内容,兩部分之間用回車換行(CRLF) 隔開。在最後一個長度為0的Chunk中的内容是稱為footer的内容,是一些附加的Header資訊(通常可以直接忽略)。
Chunk編碼的格式如下: Chunked-Body = *chunk "0" CRLF footer CRLF chunk = chunk-size [ chunk-ext ] CRLF chunk-data CRLF hex-no-zero = <HEX excluding "0"> chunk-size = hex-no-zero *HEX chunk-ext = *( ";" chunk-ext-name [ "=" chunk-ext-value ] ) chunk-ext-name = token chunk-ext-val = token | quoted-string chunk-data = chunk-size(OCTET) footer = *entity-header 即Chunk編碼由四部分組成: 1、0至多個chunk塊,2、"0" CRLF ,3、footer,4、CRLF . 而每個chunk塊由:chunk-size、chunk-ext(可選)、CRLF、chunk-data、CRLF組成。
任何不含有消息體的消息(如1XXX、204、304等響應消息和任何頭(HEAD,首部)請求的響應消息),總是由一個空行(CLRF)結束。
如果出現了Transfer-Encoding頭字段 并且值為非“identity”,那麼transfer-length由“chunked” 傳輸編碼定義,除非消息由于關閉連接配接而終止。
如果出現了Content-Length頭字段,它的值表示entity-length(實體長度)和transfer-length(傳輸長度)。如果這兩個長度的大小不一樣(i.e.設定了Transfer-Encoding頭字段),那麼将不能發送Content-Length頭字段。并且如果同時收到了Transfer-Encoding字段和Content-Length頭字段,那麼必須忽略Content-Length字段。
如果消息使用媒體類型“multipart/byteranges”,并且transfer-length 沒有另外指定,那麼這種自定界(self-delimiting)媒體類型定義transfer-length 。除非發送者知道接收者能夠解析該類型,否則不能使用該類型。
由伺服器關閉連接配接确定消息長度。(注意:關閉連接配接不能用于确定請求消息的結束,因為伺服器不能再發響應消息給用戶端了。)
為了相容HTTP/1.0應用程式,HTTP/1.1的請求消息體中必須包含一個合法的Content-Length頭字段,除非知道伺服器相容 HTTP/1.1。一個請求包含消息體,并且Content-Length字段沒有給定,如果不能判斷消息的長度,伺服器應該用用400 (bad request) 來響應;或者伺服器堅持希望收到一個合法的Content-Length字段,用 411 (length required)來響應。
所有HTTP/1.1的接收者應用程式必須接受“chunked” transfer-coding (傳輸編碼),是以當不能事先知道消息的長度,允許使用這種機制來傳輸消息。消息不應該夠同時包含 Content-Length頭字段和non-identity transfer-coding。如果一個消息同時包含non-identity transfer-coding和Content-Length ,必須忽略Content-Length 。
最後我總結下HTTP協定的頭部字段。
1、 Accept:告訴WEB伺服器自己接受什麼媒體類型,*/* 表示任何類型,type/* 表示該類型下的所有子類型,type/sub-type。
2、 Accept-Charset: 浏覽器申明自己接收的字元集
Accept-Encoding: 浏覽器申明自己接收的編碼方法,通常指定壓縮方法,是否支援壓縮,支援什麼壓縮方法(gzip,deflate)
Accept-Language:浏覽器申明自己接收的語言
語言跟字元集的差別:中文是語言,中文有多種字元集,比如big5,gb2312,gbk等等。
3、 Accept-Ranges:WEB伺服器表明自己是否接受擷取其某個實體的一部分(比如檔案的一部分)的請求。bytes:表示接受,none:表示不接受。
4、 Age:當代理伺服器用自己緩存的實體去響應請求時,用該頭部表明該實體從産生到現在經過多長時間了。
5、 Authorization:當用戶端接收到來自WEB伺服器的 WWW-Authenticate 響應時,用該頭部來回應自己的身份驗證資訊給WEB伺服器。
6、 Cache-Control:請求:no-cache(不要緩存的實體,要求現在從WEB伺服器去取)
max-age:(隻接受 Age 值小于 max-age 值,并且沒有過期的對象)
max-stale:(可以接受過去的對象,但是過期時間必須小于 max-stale 值)
min-fresh:(接受其新鮮生命期大于其目前 Age 跟 min-fresh 值之和的緩存對象)
響應:public(可以用 Cached 内容回應任何使用者)
private(隻能用緩存内容回應先前請求該内容的那個使用者)
no-cache(可以緩存,但是隻有在跟WEB伺服器驗證了其有效後,才能傳回給用戶端)
max-age:(本響應包含的對象的過期時間)
ALL: no-store(不允許緩存)
7、 Connection:請求:close(告訴WEB伺服器或者代理伺服器,在完成本次請求的響應後,斷開連接配接,不要等待本次連接配接的後續請求了)。
keepalive(告訴WEB伺服器或者代理伺服器,在完成本次請求的響應後,保持連接配接,等待本次連接配接的後續請求)。
響應:close(連接配接已經關閉)。
keepalive(連接配接保持着,在等待本次連接配接的後續請求)。
Keep-Alive:如果浏覽器請求保持連接配接,則該頭部表明希望 WEB 伺服器保持連接配接多長時間(秒)。例如:Keep-Alive:300
8、 Content-Encoding:WEB伺服器表明自己使用了什麼壓縮方法(gzip,deflate)壓縮響應中的對象。例如:Content-Encoding:gzip
9、Content-Language:WEB 伺服器告訴浏覽器自己響應的對象的語言。
10、Content-Length: WEB 伺服器告訴浏覽器自己響應的對象的長度。例如:Content-Length: 26012
11、Content-Range: WEB 伺服器表明該響應包含的部分對象為整個對象的哪個部分。例如:Content-Range: bytes 21010-47021/47022
12、Content-Type: WEB 伺服器告訴浏覽器自己響應的對象的類型。例如:Content-Type:application/xml
13、ETag:就是一個對象(比如URL)的标志值,就一個對象而言,比如一個 html 檔案,如果被修改了,其 Etag 也會别修改,是以ETag 的作用跟 Last-Modified 的作用差不多,主要供 WEB 伺服器判斷一個對象是否改變了。比如前一次請求某個 html 檔案時,獲得了其 ETag,當這次又請求這個檔案時,浏覽器就會把先前獲得的 ETag 值發送給WEB 伺服器,然後 WEB 伺服器會把這個 ETag 跟該檔案的目前 ETag 進行對比,然後就知道這個檔案有沒有改變了。
14、 Expired:WEB伺服器表明該實體将在什麼時候過期,對于過期了的對象,隻有在跟WEB伺服器驗證了其有效性後,才能用來響應客戶請求。是 HTTP/1.0 的頭部。例如:Expires:Sat, 23 May 2009 10:02:12 GMT
15、 Host:用戶端指定自己想通路的WEB伺服器的域名/IP 位址和端口号。例如:Host:rss.sina.com.cn
16、 If-Match:如果對象的 ETag 沒有改變,其實也就意味著對象沒有改變,才執行請求的動作。
17、 If-None-Match:如果對象的 ETag 改變了,其實也就意味著對象也改變了,才執行請求的動作。
18、 If-Modified-Since:如果請求的對象在該頭部指定的時間之後修改了,才執行請求的動作(比如傳回對象),否則傳回代碼304,告訴浏覽器該對象沒有修改。例如:If-Modified-Since:Thu, 10 Apr 2008 09:14:42 GMT
19、 If-Unmodified-Since:如果請求的對象在該頭部指定的時間之後沒修改過,才執行請求的動作(比如傳回對象)。
20、 If-Range:浏覽器告訴 WEB 伺服器,如果我請求的對象沒有改變,就把我缺少的部分給我,如果對象改變了,就把整個對象給我。浏覽器通過發送請求對象的 ETag 或者 自己所知道的最後修改時間給 WEB 伺服器,讓其判斷對象是否改變了。總是跟 Range 頭部一起使用。
21、 Last-Modified:WEB 伺服器認為對象的最後修改時間,比如檔案的最後修改時間,動态頁面的最後産生時間等等。例如:Last-Modified:Tue, 06 May 2008 02:42:43 GMT
23、 Pramga:主要使用 Pramga: no-cache,相當于 Cache-Control: no-cache。例如:Pragma:no-cache
24、 Proxy-Authenticate: 代理伺服器響應浏覽器,要求其提供代理身份驗證資訊。Proxy-Authorization:浏覽器響應代理伺服器的身份驗證請求,提供自己的身份資訊。
25、 Range:浏覽器(比如 Flashget 多線程下載下傳時)告訴 WEB 伺服器自己想取對象的哪部分。例如:Range: bytes=1173546-
27、 Server: WEB 伺服器表明自己是什麼軟體及版本等資訊。例如:Server:Apache/2.0.61 (Unix)
28、 User-Agent: 浏覽器表明自己的身份(是哪種浏覽器)。例如:User-Agent:Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.8.1.14) Gecko/20080404 Firefox/2、0、0、14
29、 Transfer-Encoding: WEB 伺服器表明自己對本響應消息體(不是消息體裡面的對象)作了怎樣的編碼,比如是否分塊(chunked)。例如:Transfer-Encoding: chunked
30、 Vary: WEB伺服器用該頭部的内容告訴 Cache 伺服器,在什麼條件下才能用本響應所傳回的對象響應後續的請求。假如源WEB伺服器在接到第一個請求消息時,其響應消息的頭部為:Content- Encoding: gzip; Vary: Content-Encoding那麼 Cache 伺服器會分析後續請求消息的頭部,檢查其 Accept-Encoding,是否跟先前響應的 Vary 頭部值一緻,即是否使用相同的内容編碼方法,這樣就可以防止 Cache 伺服器用自己 Cache 裡面壓縮後的實體響應給不具備解壓能力的浏覽器。例如:Vary:Accept-Encoding
31、 Via: 列出從用戶端到 OCS 或者相反方向的響應經過了哪些代理伺服器,他們用什麼協定(和版本)發送的請求。當用戶端請求到達第一個代理伺服器時,該伺服器會在自己發出的請求裡面添加 Via 頭部,并填上自己的相關資訊,當下一個代理伺服器收到第一個代理伺服器的請求時,會在自己發出的請求裡面複制前一個代理伺服器的請求的Via 頭部,并把自己的相關資訊加到後面,以此類推,當 OCS 收到最後一個代理伺服器的請求時,檢查 Via 頭部,就知道該請求所經過的路由。例如:Via:1.0 236.D0707195.sina.com.cn:80
(squid/2.6.STABLE13)
===============================================================================
HTTP 請求消息頭部執行個體:
Host:rss.sina.com.cn
User-Agent:Mozilla/5、0 (Windows; U; Windows NT 5、1; zh-CN; rv:1、8、1、14) Gecko/20080404 Firefox/2、0、0、14
Accept:text/xml,application/xml,application/xhtml+xml,text/html;q=0、9,text/plain;q=0、8,image/png,*/*;q=0、5
Accept-Language:zh-cn,zh;q=0、5
Accept-Encoding:gzip,deflate
Accept-Charset:gb2312,utf-8;q=0、7,*;q=0、7
Keep-Alive:300
Connection:keep-alive
Cookie:userId=C5bYpXrimdmsiQmsBPnE1Vn8ZQmdWSm3WRlEB3vRwTnRtW &lt;-- Cookie
If-Modified-Since:Sun, 01 Jun 2008 12:05:30 GMT
Cache-Control:max-age=0
HTTP 響應消息頭部執行個體:
Status:OK - 200 &lt;-- 響應狀态碼,表示 web 伺服器處理的結果。
Date:Sun, 01 Jun 2008 12:35:47 GMT
Server:Apache/2、0、61 (Unix)
Last-Modified:Sun, 01 Jun 2008 12:35:30 GMT
Accept-Ranges:bytes
Content-Length:18616
Cache-Control:max-age=120
Expires:Sun, 01 Jun 2008 12:37:47 GMT
Content-Type:application/xml
Age:2
X-Cache:HIT from 236-41、D07071951、sina、com、cn &lt;-- 反向代理伺服器使用的 HTTP 頭部
Via:1.0 236-41.D07071951.sina.com.cn:80 (squid/2.6.STABLE13)
Connection:close