天天看點

HTTP協定頭域字段詳細分析

HTTP(HyperTextTransferProtocol) 是超文本傳輸協定的縮寫,它用于傳送WWW方式的資料,關于HTTP協定的詳細内容請參考RFC2616。HTTP協定采用了請求/響應模型。用戶端向服 務器發送一個請求,請求頭包含請求的方法、URI、協定版本、以及包含請求修飾符、客戶資訊和内容的類似于MIME的消息結構。伺服器以一個狀态行作為響 應,相應的内容包括消息協定的版本,成功或者錯誤編碼加上包含伺服器資訊、實體元資訊以及可能的實體内容。

通常HTTP消息包括客戶機向伺服器的請求消息和伺服器向客戶機的響應消息。這兩種類型的消息由一個起始行,一個或者多個頭域,一個隻是頭域結束的空行和可選的消息體組成。HTTP的頭域包括通用頭,請求頭,響應頭和實體頭四個部分。每個頭域由一個域名,冒号(:)和域值三部分組成。域名是大小寫無關的,域值前可以添加任何數量的空格符,頭域可以被擴充為多行,在每行開始處,使用至少一個空格或制表符。

1、通用頭域

通用頭域包含請求和響應消息都支援的頭域,通用頭域包含Cache-Control、Connection、Date、Pragma、Transfer-Encoding、Upgrade、Via。對通用頭域的擴充要求通訊雙方都支援此擴充,如果存在不支援的通用頭域,一般将會作為實體頭域處理。下面簡單介紹幾個在UPnP消息中使用的通用頭域。

Cache-Control頭域

Cache-Control指定請求和響應遵循的緩存機制。在請求消息或響應消息中設定Cache-Control并不會修改另一個消息處理過程中的緩存處理過程。請求時的緩存指令包括no-cache、no- store、max-age、max-stale、min-fresh、only-if-cached,響應消息中的指令包括public、 private、no-cache、no-store、no-transform、must-revalidate、proxy-revalidate、 max-age。

各個消息中的指令含義如下:

Public訓示響應可被任何緩存區緩存。

Private訓示對于單個使用者的整個或部分響應消息,不能被共享緩存處理。這允許伺服器僅僅描述當使用者的部分響應消息,此響應消息對于其他使用者的請求無效。

no-cache訓示請求或響應消息不能緩存

no-store用于防止重要的資訊被無意的釋出。在請求消息中發送将使得請求和響應消息都不使用緩存。

max-age訓示客戶機可以接收生存期不大于指定時間(以秒為機關)的響應。

min-fresh訓示客戶機可以接收響應時間小于目前時間加上指定時間的響應。

max-stale訓示客戶機可以接收超出逾時期間的響應消息。如果指定max-stale消息的值,那麼客戶機可以接收超出逾時期指定值之内的響應消息。

Date頭域

Date頭域表示消息發送的時間,時間的描述格式由rfc822定義。例如,Date:Mon,31Dec200104:25:57GMT。Date描述的時間表示世界标準時,換算成本地時間,需要知道使用者所在的時區。

Pragma頭域

Pragma頭域用來包含實作特定的指令,最常用的是Pragma:no-cache。在HTTP/1.1協定中,它的含義和Cache-Control:no-cache相同。

2、請求消息

請求消息的第一行為下面的格式:

Method SP Request-URI SP HTTP-Version CRLF 

Method表示對于Request-URI完成的方法,這個字段是大小寫敏感的,包括OPTIONS、GET、HEAD、POST、PUT、DELETE、TRACE。方法GET和HEAD應該被所有的通用WEB伺服器支援,其他所有方法的實作是可選的。GET方法取回由Request-URI辨別的資訊。HEAD方法也是取回由Request-URI辨別的資訊,隻是可以在響應時,不傳回消息體。POST方法可以請求伺服器接收包含在請求中的實體資訊,可以用于送出表單,向新聞討論區、BBS、郵件群組和資料庫發送消息。

SP表示空格。

Request-URI遵循URI格式,在此字段為星号(*)時,說明請求并不用于某個特定的資源位址,而是用于伺服器本身。

HTTP-Version表示支援的HTTP版本,例如為HTTP/1.1。

CRLF表示換行回車符。

請求頭域允許用戶端向伺服器傳遞關于請求或者關于客戶機的附加資訊。請求頭域可能包含下列字段Accept、Accept-Charset、Accept- Encoding、Accept-Language、Authorization、From、Host、If-Modified-Since、If- Match、If-None-Match、If-Range、If-Range、If-Unmodified-Since、Max-Forwards、 Proxy-Authorization、Range、Referer、User-Agent。對請求頭域的擴充要求通訊雙方都支援,如果存在不支援的請求頭域,一般将會作為實體頭域處理。

典型的請求消息:

GEThttp://class/download.microtool.de:80/somedata.exe

Host:download.microtool.de

Accept:*/*

Pragma:no-cache

Cache-Control:no-cache

Referer:http://class/download.microtool.de/

User-Agent:Mozilla/4.04[en](Win95;I;Nav)

Range:bytes=554554-

上例第一行表示HTTP用戶端(可能是浏覽器、下載下傳程式)通過GET方法獲得指定URL下的檔案。棕色的部分表示請求頭域的資訊,綠色的部分表示通用頭部分。

Host頭域

Host頭域指定請求資源的Intenet主機和端口号,必須表示請求url的原始伺服器或網關的位置。HTTP/1.1請求必須包含主機頭域,否則系統會以400狀态碼傳回。

Referer頭域

Referer頭域允許用戶端指定請求uri的源資源位址,這可以允許伺服器生成回退連結清單,可用來登陸、優化cache等。他也允許廢除的或錯誤的連接配接由于維護的目的被追蹤。如果請求的uri沒有自己的uri位址,Referer不能被發送。如果指定的是部分uri位址,則此位址應該是一個相對位址。

Range頭域

Range頭域可以請求實體的一個或者多個子範圍。例如,

表示頭500個位元組:bytes=0-499

表示第二個500位元組:bytes=500-999

表示最後500個位元組:bytes=-500

表示500位元組以後的範圍:bytes=500-

第一個和最後一個位元組:bytes=0-0,-1

同時指定幾個範圍:bytes=500-600,601-999

但是伺服器可以忽略此請求頭,如果無條件GET包含Range請求頭,響應會以狀态碼206(PartialContent)傳回而不是以200(OK)。

User-Agent頭域

User-Agent頭域的内容包含送出請求的使用者資訊。

3、響應消息

響應消息的第一行為下面的格式:

HTTP-Version SP Status-Code SP Reason-Phrase CRLF

HTTP-Version表示支援的HTTP版本,例如為HTTP/1.1。

Status-Code是一個三個數字的結果代碼。

Reason-Phrase給Status-Code提供一個簡單的文本描述。Status-Code主要用于機器自動識别,Reason-Phrase主要用于幫助使用者了解。Status-Code的第一個數字定義響應的類别,後兩個數字沒有分類的作用。第一個數字可能取5個不同的值:

1xx:資訊響應類,表示接收到請求并且繼續處理

2xx:處理成功響應類,表示動作被成功接收、了解和接受

3xx:重定向響應類,為了完成指定的動作,必須接受進一步處理

4xx:用戶端錯誤,客戶請求包含文法錯誤或者是不能正确執行

5xx:服務端錯誤,伺服器不能正确執行一個正确的請求

響應頭域允許伺服器傳遞不能放在狀态行的附加資訊,這些域主要描述伺服器的資訊和Request-URI進一步的資訊。響應頭域包含Age、 Location、Proxy-Authenticate、Public、Retry-After、Server、Vary、Warning、WWW- Authenticate。對響應頭域的擴充要求通訊雙方都支援,如果存在不支援的響應頭域,一般将會作為實體頭域處理。

典型的響應消息:

HTTP/1.0200OK

Date:Mon,31Dec200104:25:57GMT

Server:Apache/1.3.14(Unix)

Content-type:text/html

Last-modified:Tue,17Apr200106:46:28GMT

Etag:"a030f020ac7c01:1e9f"

Content-length:39725426

Content-range:bytes554554-40279979/40279980

上例第一行表示HTTP服務端響應一個GET方法。棕色的部分表示響應頭域的資訊,綠色的部分表示通用頭部分,紅色的部分表示實體頭域的資訊。

Location響應頭

Location響應頭用于重定向接收者到一個新URI位址。

Server響應頭

Server響應頭包含處理請求的原始伺服器的軟體資訊。此域能包含多個産品辨別和注釋,産品辨別一般按照重要性排序。

4、實體資訊

請求消息和響應消息都可以包含實體資訊,實體資訊一般由實體頭域和實體組成。實體頭域包含關于實體的原資訊,實體頭包括Allow、Content-Base、Content-Encoding、Content-Language、 Content-Length、Content-Location、Content-MD5、Content-Range、Content-Type、 Etag、Expires、Last-Modified、extension-header。extension-header允許用戶端定義新的實體頭,但是這些域可能無法未接受方識别。實體可以是一個經過編碼的位元組流,它的編碼方式由Content-Encoding或Content-Type定義,它的長度由Content-Length或Content-Range定義。

Content-Type實體頭

Content-Type 實體頭用于向接收方訓示實體的媒體類型,指定HEAD方法送到接收方的實體媒體類型,或GET方法發送的請求媒體類型Content-Range實體頭

Content-Range實體頭

用于指定整個實體中的一部分的插入位置,他也訓示了整個實體的長度。在伺服器向客戶傳回一個部分響應,它必須描述響應覆寫的範圍和整個實體長度。一般格式:

Content-Range:bytes-unit SP first-byte-pos - last-byte-pos/entity-legth

例如,傳送頭500個位元組次字段的形式:Content-Range:bytes0-499/1234如果一個http消息包含此節(例如,對範圍請求的響應或對一系列範圍的重疊請求),Content-Range表示傳送的範圍,Content-Length表示實際傳送的位元組數。

Last-modified實體頭

Last-modified實體頭指定伺服器上儲存内容的最後修訂時間。

5、 HTTP 頭參考(microsoft)

HTTP 請求和 HTTP 響應都使用頭發送有關 HTTP 消息的資訊。頭由一系列行組成,每行都包含名稱,然後依次是冒号、空格、值。字段可按任何順序排列。某些頭字段既能用于請求頭也能用于響應頭,而另一些頭字段隻能用于其中之一。 

許多請求頭字段都允許用戶端在值部分指定多個可接受的選項,有時甚至可以對這些選項的首選項進行排名。多個項以逗号分隔。例如,用戶端可以發送包含 “Content-Encoding: gzip, compress,”的請求頭,表示可以接受各種壓縮類型。如果伺服器的響應正文使用 gzip 編碼,其響應頭中将包含“Content-Encoding: gzip”。

有些字段可以在單個頭中出現多次。例如,頭可以有多個“Warning”字段。

下表列出了 HTTP 1.1 頭字段。注意:有些頭字段是 MIME 字段。MIME 字段在 Internet Engineering Task Force (IETF) 文檔 RFC 2045 中進行了定義,但也可用于 HTTP 1.1 協定。有關 MIME 和 HTTP 1.1 規範的詳細資訊,請參閱 IEIF 頁。

通用頭字段

可用于請求消息和響應消息。

名稱       示例值 

Cache-Control  "max-age=10" 

Connection "close" 

Date  "Tue, 11 Jul 2000 18:23:51 GMT" 

Pragma "no-cache" 

Trailer "Date" 

Transfer-Encoding   "chunked" 

Upgrade "SHTTP/1.3" 

Via "HTTP/1.1 Proxy1, HTTP/1.1 Proxy2" 

Warning "112 Disconnected Operation" 

請求頭字段 

  請求頭字段僅用于請求消息。

 名稱        示例值 

Accept "text/html, image/*" 

Accept-Charset "iso8859-5" 

Accept-Encoding  "gzip, compress" 

Accept-Language "en, fr" 

Authorization [credentials] 

Content-Encoding "gzip" 

Expect "100-continue" 

From "[email protected]" 

Host "www.microsoft.com" 

If-Match "entity_tag001" 

If-Modified-Since  "Tue, 11 Jul 2000 18:23:51 GMT" 

If-None-Match "entity_tag001" 

If-Range "entity_tag001" or "Tue, 11 Jul 2000 18:23:51 GMT" 

If-Unmodified-Since  "Tue, 11 Jul 2000 18:23:51 GMT" 

Max-Forwards "3" 

Proxy-Authorization [credentials] 

Range "bytes=100-599" 

Referer "http://www.microsoft.com/resources.asp" 

TE "trailers" 

User-Agent "Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.0)"

響應頭字段 

響應頭字段僅用于響應消息。

  名稱          示例值 

Accept-Ranges        "none" 

Age                          "2147483648(2^31)" 

ETag                       "b38b9-17dd-367c5dcd" 

Last-Modified          "Tue, 11 Jul 2000 18:23:51 GMT" 

Location                  "http://localhost/redirecttarget.asp" 

Proxy-Authenticate   [challenge] 

Retry-After             "Tue, 11 Jul 2000 18:23:51 GMT" or "60" 

Server                    "Microsoft-IIS/5.0" 

Vary                       "Date" 

WWW-Authenticate   [challenge] 

實體頭字段 

實體頭字段可以用于請求消息或響應消息。實體頭字段中包含消息實體正文的有關資訊,如使用的編碼格式。

   名稱         示例值 

Allow                             "GET, HEAD" 

Content-Encoding        "gzip" 

Content-Language       "en" 

Content-Length            "8445" 

Content-Location         "http://localhost/page.asp" 

Content-MD5              [md5-digest] 

Content-Range           "bytes 2543-4532/7898" 

Content-Type             "text/html" 

Expires                       "Tue, 11 Jul 2000 18:23:51 GMT" 

Last-Modified             "Tue, 11 Jul 2000 18:23:51 GMT" 

>>>>>>>HTTP頭字段的具體含義<<<<<<<<<<<<<<<

通用頭字段:

Cache-Control  用于指定緩存指令,緩存指令是單向的且是獨立的
Date 表示消息産生的日期和時間
Connection 允許發送指定連接配接的選項
Trailer 指出給出的頭部域集合在以chunked transfer-coding 編碼的消息的尾巴中存在
Pragma 用來包含實作特定的指令
Transfer-Encoding 指出為了安全在發送方和接收方間傳輸,已經應用什麼類型的轉換(若有的話)到消息主體上
Upgrad 允許用戶端指定它所支援的其它通迅協定,且願意使用之,若伺服器發現切換協定是适當的
Via 列出從用戶端到 OCS 或者相反方向的響應經過了哪些代理伺服器,他們用什麼協定(和版本)發送的請求。
Warning 用于挾帶關于消息的狀态和轉換的額外資訊,它可能不會在消息中反映。

請求頭字段:

Accept 請求報頭域用于指定用戶端接受哪些類型的資訊
Accept-Charset 請求報頭域用于指定用戶端接受的字元集。
Accept-Encoding 請求報頭域類似于Accept,但是它是用于指定可接受的内容編碼。
Accept-Language 請求報頭域類似于Accept,但是它是用于指定一種自然語言
Authorization 請求報頭域主要用于證明用戶端有權檢視某個資源。
Expect 用于指出用戶端要求的特殊伺服器行為
From 請求發送者的email位址,由一些特殊的Web客戶程式使用,浏覽器不會用到它。
Host 用于指定被請求資源的Internet主機和端口号,它通常從HTTP URL中提取出來的,(發送請求時,該報頭域是必需的)
If- Match 如果對象的 ETag 沒有改變,其實也就意味著對象沒有改變,才執行請求的動作。
If-Modified-Since 隻有當所請求的内容在指定的日期之後又經過修改才傳回它,否則傳回304“Not Modified”應答。
If-None-Match 如果對象的 ETag 改變了,其實也就意味著對象也改變了,才執行請求的動作。
If-Range 浏覽器告訴 WEB 伺服器,如果我請求的對象沒有改變,就把我缺少的部分給我,如果對象改變了,就把整個對象給我。
If-Unmodified-Since 如果請求的對象在該頭部指定的時間之後沒修改過,才執行請求的動作(比如傳回對象)。
Max-Forwards 提供某種機制,TRACE和OPTIONS方法用來限制可以轉發該請求給下個入界伺服器的代理或網關的數量
Proxy-Authorization 浏覽器響應代理伺服器的身份驗證請求,提供自己的身份資訊。
Range 浏覽器(比如 Flashget 多線程下載下傳時)告訴 WEB 伺服器自己想取對象的哪部分。
Referer 允許用戶端指定請求uri的源資源位址,
TE 指出願意在響應中接受任何擴充transfer-coding,且是否願意接受chunked transfer-coding中的尾巴域。
User-Agent 請求報頭域允許用戶端将它的作業系統、浏覽器和其它屬性告訴伺服器。
Content-Length 表示請求消息正文的長度。
Cookie 設定cookie,這是最重要的請求頭資訊之一
UA-Pixels 由某些版本的IE浏覽器所發送的非标準的請求頭,表示螢幕大小
UA-Color 由某些版本的IE浏覽器所發送的非标準的請求頭,表示顔色深度
UA-OS 由某些版本的IE浏覽器所發送的非标準的請求頭,表示作業系統
UA-CPU 由某些版本的IE浏覽器所發送的非标準的請求頭,表示CPU類型

響應頭字段: 

Accept-Ranges WEB伺服器表明自己是否接受擷取其某個實體的一部分(比如檔案的一部分)的請求
Age 當代理伺服器用自己緩存的實體去響應請求時,用該頭部表明該實體從産生到現在經過多長時間了。
Etag 提供所請求變量的實體标簽的目前值
Location Location響應報頭域用于重定向接受者到一個新的位置。Location響應報頭域常用在更換域名的時候。
Proxy-Authenticate 代理伺服器響應浏覽器,要求其提供代理身份驗證資訊。
Retry- After 用于指出希望該服務對請求用戶端可以維持有效多長,或者要求使用者代理在重定向請求前應等待的最小時間。
Server Server響應報頭域包含了伺服器用來處理請求的軟體資訊。
Vary WEB 伺服器表明自己對本響應消息體(不是消息體裡面的對象)作了怎樣的編碼,比如是否分塊(chunked)。
WWW-Authenticate

必須被包含在401(未授權的)響應消息中,用戶端收到401響應消息時候,并發送Authorization

報頭域請求伺服器對其進行驗證時,服務端響應報頭就包含該報頭域。

實體頭字段:

Allow 伺服器支援哪些請求方法
Content-Encoding 被用作媒體類型的修飾符,它的值訓示了已經被應用到實體正文的附加内容的編碼,用于記錄文檔的壓縮方法
Content-Language 描述了資源所用的自然語言
Content-Length 用于指明實體正文的長度,以位元組方式存儲的十進制數字來表示。
Content-Location 用于提供消息封裝的實體的資源位置,當實體從獨立于所請求資源的URI 的位置可通路時
Content-MD5 是提供對entity-body 的端到端消息完整性檢查(MIC)
Content-Range 與部分entity-body一起發送,以指定該部分主體應該應用到全部entity-body的哪個地方
Content-Type 用語指明發送給接收者的實體正文的媒體類型
Expires 給出響應過期的日期和時間。
Last-Modified 用于訓示資源的最後修改日期和時間。
extension-header 機制允許定義額外的entity-header 域而不改變協定,但不能假設接收方認識這些域。

繼續閱讀