天天看點

HTTP

引言

http是一個屬于應用層的面向對象的協定,由于其簡捷、快速的方式,适用于分布式超媒體資訊系統。它于1990年提出,經過幾年的使用與發展,得到不斷地完善和擴充。目前在www中使用的是http/1.0的第六版,http/1.1的規範化工作正在進行之中,而且http-ng(next generation of http)的建議已經提出。

http協定的主要特點可概括如下:

1.支援客戶/伺服器模式。

2.簡單快速:客戶向伺服器請求服務時,隻需傳送請求方法和路徑。請求方法常用的有get、head、post。每種方法規定了客戶與伺服器聯系的類型不同。由于http協定簡單,使得http伺服器的程式規模小,因而通信速度很快。

3.靈活:http允許傳輸任意類型的資料對象。正在傳輸的類型由content-type加以标記。

4.無連接配接:無連接配接的含義是限制每次連接配接隻處理一個請求。伺服器處理完客戶的請求,并收到客戶的應答後,即斷開連接配接。采用這種方式可以節省傳輸時間。

5.無狀态:http協定是無狀态協定。無狀态是指協定對于事務處理沒有記憶能力。缺少狀态意味着如果後續處理需要前面的資訊,則它必須重傳,這樣可能導緻每次連接配接傳送的資料量增大。另一方面,在伺服器不需要先前資訊時它的應答就較快。

一、http協定詳解之url篇

http url (url是一種特殊類型的uri,包含了用于查找某個資源的足夠的資訊)的格式如下:

http表示要通過http協定來定位網絡資源;host表示合法的internet主機域名或者ip位址;port指定一個端口号,為空則使用預設端口80;abs_path指定請求資源的uri;如果url中沒有給出abs_path,那麼當它作為請求uri時,必須以“/”的形式給出,通常這個工作浏覽器自動幫我們完成。

eg:

1、輸入:www.guet.edu.cn

二、http協定詳解之請求篇

1、請求行以一個方法符号開頭,以空格分開,後面跟着請求的uri和協定的版本,格式如下:method request-uri http-version crlf

其中 method表示請求方法;request-uri是一個統一資源辨別符;http-version表示請求的http協定版本;crlf表示回車和換行(除了作為結尾的crlf外,不允許出現單獨的cr或lf字元)。

請求方法(所有方法全為大寫)有多種,各個方法的解釋如下:

get 請求擷取request-uri所辨別的資源

post 在request-uri所辨別的資源後附加新的資料

head 請求擷取由request-uri所辨別的資源的響應消息報頭

put 請求伺服器存儲一個資源,并用request-uri作為其辨別

delete 請求伺服器删除request-uri所辨別的資源

trace 請求伺服器回送收到的請求資訊,主要用于測試或診斷

connect 保留将來使用

options 請求查詢伺服器的性能,或者查詢與資源相關的選項和需求

應用舉例:

get方法:在浏覽器的位址欄中輸入網址的方式通路網頁時,浏覽器采用get方法向伺服器擷取資源,eg:get /form.html http/1.1 (crlf)

post方法要求被請求伺服器接受附在請求後面的資料,常用于送出表單。

eg:post /reg.jsp http/ (crlf)

accept:image/gif,image/x-xbit,... (crlf)

...

host:www.guet.edu.cn (crlf)

content-length:22 (crlf)

connection:keep-alive (crlf)

cache-control:no-cache (crlf)

(crlf) //該crlf表示消息報頭已經結束,在此之前為消息報頭

user=jeffrey&pwd=1234 //此行以下為送出的資料

head方法與get方法幾乎是一樣的,對于head請求的回應部分來說,它的http頭部中包含的資訊與通過get請求所得到的資訊是相同的。利用這個方法,不必傳輸整個資源内容,就可以得到request-uri所辨別的資源的資訊。該方法常用于測試超連結的有效性,是否可以通路,以及最近是否更新。

2、請求報頭後述

3、請求正文(略)

三、http協定詳解之響應篇

http響應也是由三個部分組成,分别是:狀态行、消息報頭、響應正文

1、狀态行格式如下:

http-version status-code reason-phrase crlf

其中,http-version表示伺服器http協定的版本;status-code表示伺服器發回的響應狀态代碼;reason-phrase表示狀态代碼的文本描述。

狀态代碼有三位數字組成,第一個數字定義了響應的類别,且有五種可能取值:

1xx:訓示資訊--表示請求已接收,繼續處理

2xx:成功--表示請求已被成功接收、了解、接受

3xx:重定向--要完成請求必須進行更進一步的操作

4xx:用戶端錯誤--請求有文法錯誤或請求無法實作

5xx:伺服器端錯誤--伺服器未能實作合法的請求

常見狀态代碼、狀态描述、說明:

200 ok //用戶端請求成功

400 bad request //用戶端請求有文法錯誤,不能被伺服器所了解

401 unauthorized //請求未經授權,這個狀态代碼必須和www-authenticate報頭域一起使用

403 forbidden //伺服器收到請求,但是拒絕提供服務

404 not found //請求資源不存在,eg:輸入了錯誤的url

500 internal server error //伺服器發生不可預期的錯誤

503 server unavailable //伺服器目前不能處理用戶端的請求,一段時間後可能恢複正常

eg:http/1.1 200 ok (crlf)

2、響應報頭後述

3、響應正文就是伺服器傳回的資源的内容

四、http協定詳解之消息報頭篇

http消息報頭包括普通報頭、請求報頭、響應報頭、實體報頭。

每一個報頭域都是由名字+“:”+空格+值 組成,消息報頭域的名字是大小寫無關的。

1、普通報頭

在普通報頭中,有少數報頭域用于所有的請求和響應消息,但并不用于被傳輸的實體,隻用于傳輸的消息。

eg:

cache-control 用于指定緩存指令,緩存指令是單向的(響應中出現的緩存指令在請求中未必會出現),且是獨立的(一個消息的緩存指令不會影響另一個消息處理的緩存機制),http1.0使用的類似的報頭域為pragma。

請求時的緩存指令包括:no-cache(用于訓示請求或響應消息不能緩存)、no-store、max-age、max-stale、min-fresh、only-if-cached;

響應時的緩存指令包括:public、private、no-cache、no-store、no-transform、must-revalidate、proxy-revalidate、max-age、s-maxage.

eg:為了訓示ie浏覽器(用戶端)不要緩存頁面,伺服器端的jsp程式可以編寫如下:response.sehheader("cache-control","no-cache");

//response.setheader("pragma","no-cache");作用相當于上述代碼,通常兩者//合用

這句代碼将在發送的響應消息中設定普通報頭域:cache-control:no-cache

date普通報頭域表示消息産生的日期和時間

connection普通報頭域允許發送指定連接配接的選項。例如指定連接配接是連續,或者指定“close”選項,通知伺服器,在響應完成後,關閉連接配接

2、請求報頭

請求報頭允許用戶端向伺服器端傳遞請求的附加資訊以及用戶端自身的資訊。

常用的請求報頭

accept

accept請求報頭域用于指定用戶端接受哪些類型的資訊。eg:accept:image/gif,表明用戶端希望接受gif圖象格式的資源;accept:text/html,表明用戶端希望接受html文本。

accept-charset

accept-charset請求報頭域用于指定用戶端接受的字元集。eg:accept-charset:iso-8859-1,gb2312.如果在請求消息中沒有設定這個域,預設是任何字元集都可以接受。

accept-encoding

accept-encoding請求報頭域類似于accept,但是它是用于指定可接受的内容編碼。eg:accept-encoding:gzip.deflate.如果請求消息中沒有設定這個域伺服器假定用戶端對各種内容編碼都可以接受。

accept-language

accept-language請求報頭域類似于accept,但是它是用于指定一種自然語言。eg:accept-language:zh-cn.如果請求消息中沒有設定這個報頭域,伺服器假定用戶端對各種語言都可以接受。

authorization

authorization請求報頭域主要用于證明用戶端有權檢視某個資源。當浏覽器通路一個頁面時,如果收到伺服器的響應代碼為401(未授權),可以發送一個包含authorization請求報頭域的請求,要求伺服器對其進行驗證。

host(發送請求時,該報頭域是必需的)

host請求報頭域主要用于指定被請求資源的internet主機和端口号,它通常從http url中提取出來的,eg:

浏覽器發送的請求消息中,就會包含host請求報頭域,如下:

host:www.guet.edu.cn

此處使用預設端口号80,若指定了端口号,則變成:host:www.guet.edu.cn:指定端口号

user-agent

我們上網登陸論壇的時候,往往會看到一些歡迎資訊,其中列出了你的作業系統的名稱和版本,你所使用的浏覽器的名稱和版本,這往往讓很多人感到很神奇,實際上,伺服器應用程式就是從user-agent這個請求報頭域中擷取到這些資訊。user-agent請求報頭域允許用戶端将它的作業系統、浏覽器和其它屬性告訴伺服器。不過,這個報頭域不是必需的,如果我們自己編寫一個浏覽器,不使用user-agent請求報頭域,那麼伺服器端就無法得知我們的資訊了。

請求報頭舉例:

get /form.html http/1.1 (crlf)

accept:image/gif,image/x-xbitmap,image/jpeg,application/x-shockwave-flash,application/vnd.ms-excel,application/vnd.ms-powerpoint,application/msword,/ (crlf)

accept-language:zh-cn (crlf)

accept-encoding:gzip,deflate (crlf)

if-modified-since:wed,05 jan 2007 11:21:25 gmt (crlf)

if-none-match:w/"80b1a4c018f3c41:8317" (crlf)

user-agent:mozilla/4.0(compatible;msie6.0;windows nt 5.0) (crlf)

(crlf)

3、響應報頭

響應報頭允許伺服器傳遞不能放在狀态行中的附加響應資訊,以及關于伺服器的資訊和對request-uri所辨別的資源進行下一步通路的資訊。

常用的響應報頭

location

location響應報頭域用于重定向接受者到一個新的位置。location響應報頭域常用在更換域名的時候。

server

server響應報頭域包含了伺服器用來處理請求的軟體資訊。與user-agent請求報頭域是相對應的。下面是

server響應報頭域的一個例子:

server:apache-coyote/1.1

www-authenticate

www-authenticate響應報頭域必須被包含在401(未授權的)響應消息中,用戶端收到401響應消息時候,并發送authorization報頭域請求伺服器對其進行驗證時,服務端響應報頭就包含該報頭域。

eg:www-authenticate:basic realm="basic auth test!" //可以看出伺服器對請求資源采用的是基本驗證機制。

4、實體報頭

請求和響應消息都可以傳送一個實體。一個實體由實體報頭域和實體正文組成,但并不是說實體報頭域和實體正文要在一起發送,可以隻發送實體報頭域。實體報頭定義了關于實體正文(eg:有無實體正文)和請求所辨別的資源的元資訊。

常用的實體報頭

content-encoding

content-encoding實體報頭域被用作媒體類型的修飾符,它的值訓示了已經被應用到實體正文的附加内容的編碼,因而要獲得content-type報頭域中所引用的媒體類型,必須采用相應的解碼機制。content-encoding這樣用于記錄文檔的壓縮方法,eg:content-encoding:gzip

content-language

content-language實體報頭域描述了資源所用的自然語言。沒有設定該域則認為實體内容将提供給所有的語言閱讀

者。eg:content-language:da

content-length

content-length實體報頭域用于指明實體正文的長度,以位元組方式存儲的十進制數字來表示。

content-type

content-type實體報頭域用語指明發送給接收者的實體正文的媒體類型。eg:

content-type:text/html;charset=iso-8859-1

content-type:text/html;charset=gb2312

last-modified

last-modified實體報頭域用于訓示資源的最後修改日期和時間。

expires

expires實體報頭域給出響應過期的日期和時間。為了讓代理伺服器或浏覽器在一段時間以後更新緩存中(再次通路曾通路過的頁面時,直接從緩存中加載,縮短響應時間和降低伺服器負載)的頁面,我們可以使用expires實體報頭域指定頁面過期的時間。eg:expires:thu,15 sep 2006 16:23:12 gmt

http1.1的用戶端和緩存必須将其他非法的日期格式(包括0)看作已經過期。eg:為了讓浏覽器不要緩存頁面,我們也可以利用expires實體報頭域,設定為0,jsp中程式如下:response.setdateheader("expires","0");

五、利用telnet觀察http協定的通訊過程

1、打開telnet

1.1 打開telnet

運作-->cmd-->telnet

1.2 打開telnet回顯功能

set localecho

2、連接配接伺服器并發送請求

2.1 open www.guet.edu.cn 80 //注意端口号不能省略

/我們可以變換請求方法,請求桂林電子首頁内容,輸入消息如下/

2.2 open www.sina.com.cn 80 //在指令提示符号下直接輸入telnet www.sina.com.cn 80

3 實驗結果:

3.1 請求資訊2.1得到的響應是:

http/1.1 200 ok //請求成功

server: microsoft-iis/5.0 //web伺服器

date: thu,08 mar 200707:17:51 gmt

connection: keep-alive

content-length: 23330

content-type: text/html

expries: thu,08 mar 2007 07:16:51 gmt

set-cookie: aspsessionidqaqbqqqb=bejcdgkadedjklkkajeoimmh; path=/

cache-control: private

//資源内容省略

3.2 請求資訊2.2得到的響應是:

http/1.0 404 not found //請求失敗

date: thu, 08 mar 2007 07:50:50 gmt

server: apache/2.0.54

last-modified: thu, 30 nov 2006 11:35:41 gmt

etag: "6277a-415-e7c76980"

accept-ranges: bytes

x-powered-by: mod_xlayout_jh/0.0.1vhs.markii.remix

vary: accept-encoding

x-cache: miss from zjm152-78.sina.com.cn

via: 1.0 zjm152-78.sina.com.cn:80

x-cache: miss from th-143.sina.com.cn

connection: close

失去了跟主機的連接配接

按任意鍵繼續...

4 .注意事項:1、出現輸入錯誤,則請求不會成功。

六、http協定相關技術補充

中介由三種:代理(proxy)、網關(gateway)和通道(tunnel),一個代理根據uri的絕對格式來接受請求,重寫全部或部分消息,通過 uri的辨別把已格式化過的請求發送到伺服器。網關是一個接收代理,作為一些其它伺服器的上層,并且如果必須的話,可以把請求翻譯給下層的伺服器協定。一 個通道作為不改變消息的兩個連接配接之間的中繼點。當通訊需要通過一個中介(例如:防火牆等)或者是中介不能識别消息的内容時,通道經常被使用。

網關(gateway):一個作為其它伺服器中間媒介的伺服器。與代理不同的是,網關接受請求就好象對被請求的資源來說它就是源伺服器;送出請求的客戶機并沒有意識到它在同網關打交道。

網關經常作為通過防火牆的伺服器端的門戶,網關還可以作為一個協定翻譯器以便存取那些存儲在非http系統中的資源。

2、協定分析的優勢—http分析器檢測網絡攻擊

以子產品化的方式對高層協定進行分析處理,将是未來入侵檢測的方向。

http及其代理的常用端口80、3128和8080在network部分用port标簽進行了規定

3、http協定content lenth限制漏洞導緻拒絕服務攻擊

使用post方法時,可以設定contentlenth來定義需要傳送的資料長度,例如contentlenth:999999999,在傳送完成前,内 存不會釋放,攻擊者可以利用這個缺陷,連續向web伺服器發送垃圾資料直至web伺服器記憶體耗盡。這種攻擊方法基本不會留下痕迹。

<a href="http://www.cnpaf.net/class/http/0532918532667330.html">http://www.cnpaf.net/class/http/0532918532667330.html</a>

4、利用http協定的特性進行拒絕服務攻擊的一些構思

伺服器端忙于處理攻擊者僞造的tcp連接配接請求而無暇理睬客戶的正常請求(畢竟用戶端的正常請求比率非常之小),此時從正常客戶的角度看來,伺服器失去響應,這種情況我們稱作:伺服器端受到了synflood攻擊(syn洪水攻擊)。

而smurf、teardrop等是利用icmp封包來flood和ip碎片攻擊的。本文用“正常連接配接”的方法來産生拒絕服務攻擊。

19端口在早期已經有人用來做chargen攻擊了,即chargen_denial_of_service,但是!他們用的方法是在兩台chargen 伺服器之間産生udp連接配接,讓伺服器處理過多資訊而down掉,那麼,幹掉一台web伺服器的條件就必須有2個:1.有chargen服務2.有http 服務

方法:攻擊者僞造源ip給n台chargen發送連接配接請求(connect),chargen接收到連接配接後就會傳回每秒72位元組的字元流(實際上根據網絡實際情況,這個速度更快)給伺服器。

5、http指紋識别技術

http指紋識别的原理大緻上也是相同的:記錄不同伺服器對http協定執行中的微小差别進行識别.http指紋識别比tcp/ip堆棧指紋識别複雜許 多,理由是定制http伺服器的配置檔案、增加插件或元件使得更改http的響應資訊變的很容易,這樣使得識别變的困難;然而定制tcp/ip堆棧的行為 需要對核心層進行修改,是以就容易識别.

常用測試請求:

1:head/http/1.0發送基本的http請求

2:delete/http/1.0發送那些不被允許的請求,比如delete請求

3:get/http/3.0發送一個非法版本的http協定請求

4:get/junk/1.0發送一個不正确規格的http協定請求

http指紋識别工具httprint,它通過運用統計學原理,組合模糊的邏輯學技術,能很有效的确定http伺服器的類型.它可以被用來收集和分析不同http伺服器産生的簽名。

6、其他:為了提高使用者使用浏覽器時的性能,現代浏覽器還支援并發的通路方式,浏覽一個網頁時同時建立多個連接配接,以迅速獲得一個網頁上的多個圖示,這樣能更快速完成整個網頁的傳輸。

http1.1中提供了這種持續連接配接的方式,而下一代http協定:http-ng更增加了有關會話控制、豐富的内容協商等方式的支援,來提供

更高效率的連接配接。

繼續閱讀