天天看點

HTTP協定封包格式

  作为一个初学者,本来以为这些TCP/IP、UDP协议仅仅是标准,稍微了解一下就行,后来发现,仅仅了解完全不够。

 

HTTP报文有两种:请求报文,响应报文。

请求报文

HTTP協定封包格式

 

GET /search?hl=zh-CN&source=hp&q=domety&aq=f&oq= HTTP/1.1 

Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/vnd.ms-excel, application/vnd.ms-powerpoint, 

application/msword, application/x-silverlight, application/x-shockwave-flash, / 

Referer: http://www.google.cn/ 

Accept-Language: zh-cn 

Accept-Encoding: gzip, deflate 

User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; TheWorld) 

Host: www.google.cn 

Connection: Keep-Alive 

Cookie: PREF=ID=80a06da87be9ae3c:U=f7167333e2c3b714:NW=1:TM=1261551909:LM=1261551917:S=ybYcq2wpfefs4V9g; 

NID=31=ojj8d-IygaEtSxLgaJmqSjVhCspkviJrB6omjamNrSm8lZhKy_yMfO2M4QMRKcH1g0iQv9u-2hfBW7bUFwVh7pGaRUb0RnHcJU37y- 

FxlRugatx63JLv7CWMD6UB_O_r

观察发现,报文是用普通的ASCII文本书写。其次,报文有很多行,每行用一个回车换行符结束。 

第一行:请求行(request line),第一行后面的行,为首部行(header line)。 

请求行———————————————

GET /search?hl=zh-CN&source=hp&q=domety&aq=f&oq= HTTP/1.1
           
  • 1

有3个字段:方法字段,URL字段,HTTP协议版本字段。 

方法字段:GET,POST,HEAD,PUT,DELETE。

当浏览器请求一个对象时,使用GET方法,在URL字段填写该对象的URL地址。 

 

【

GET

最常见的一种请求方式,当客户端要从服务器中读取文档时,当点击网页上的链接或者通过在浏览器的地址栏输入网址来浏览网页的,使用的都是GET方式。GET方法要求服务器将URL定位的资源放在响应报文的数据部分,回送给客户端。使用GET方法时,请求参数和对应的值附加在URL后面,利用一个问号(“?”)代表URL的结尾与请求参数的开始,传递参数长度受限制。例如,/index.jsp?id=100&op=bind,这样通过GET方式传递的数据直接表示在地址中,所以我们可以把请求结果以链接的形式发送给好友。

POST

对于上面提到的不适合使用GET方式的情况,可以考虑使用POST方式,因为使用POST方法可以允许客户端给服务器提供信息较多。POST方法将请求参数封装在HTTP请求数据中,以名称/值的形式出现,可以传输大量数据,这样POST方式对传送的数据大小没有限制,而且也不会显示在URL中。

 

HEAD

HEAD就像GET,只不过服务端接受到HEAD请求后只返回响应头,而不会发送响应内容。当我们只需要查看某个页面的状态的时候,使用HEAD是非常高效的,因为在传输的过程中省去了页面内容。

】首部行——————- 

首部行提供的信息是WEB代理缓存所要求的。

Host: <a href="http://www.google.cn" target="_blank" rel="external nofollow" >www.google.cn</a>
           
  • 1

定义了目标所在的主机。

Connection: Keep-Alive 
           
  • 1

浏览器告诉服务器使用持久连接, close 则 使用非持久连接,即要求服务器在发送请求的对象后就关闭连接,

User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; TheWorld)  
           
  • 1

定义用户代理,即向服务器发送请求的浏览器类型。 Mozilla/4.0为Netscape浏览器。因此服务器可以正确地为不同类型的用户代理实际发送相同的对象不同的版本。

Accept-Language: zh-cn  
           
  • 1

表示用户想得到该对象的语言版本, 

。。。。。。。。。。。总之,HTTP请求报文中有很多可选的首部行 

- - - - - - - - -下面看看请求报文的通用格式 

- 

HTTP協定封包格式

在首部行后有一个“实体主体”(entity body)使用GET方法是实体主体为空。 

客户机通常在提交表单时使用POST方法,实体主体中包含的就是表单字段中输入的值 

HEAD方法类似于GET方法,当服务器收到使用HEAD方法的请求时,会使用一个HTTP报文进行响应,但是并不是返回请求对象。应用程序开发者常用HEAD方法进行故障跟踪。 

PUT方法常与WEB发行工具联合使用,用户利用他将对象上传到指定服务器的指定路径(目录)。也用来向服务器上传对象。 

DELETE方法,应用程序可删除WEB服务器上的对象。

响应报文

栗子—-

HTTP/1.1 200 OK
Date: Sat, 31 Dec 2005 23:59:59 GMT
Connection: Keep-Alive 
Content-Type: text/html;charset=ISO-8859-1
Content-Length: 122

<html>
<head>
<title>Wrox Homepage</title>
</head>
<body>
<!-- body goes here -->
</body>
</html>
           
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14

响应报文分成三个部分: 

初始状态行(status line) 

首部行(header line) 

实体主题(entity body) 

实体主体部分是报文的主体,即他包含了所有请求的对象本身

HTTP協定封包格式

状态行有3个字段:协议版本,状态码,相应状态信息。

HTTP/1.1 200 OK
           
  • 1

在这个栗子中,状态行指示服务器使用的协议是HTTP/1.1,并且一切正常(服务器已找到并正在发送所请求的对象)

再看看首部行,

Connection: close
           
  • 1

这个首部行告诉客户机在报文发送完后关闭了该TCP连接。

Date:….首部行指示服务器产生并发送该相应报文的日期和时间。这个时间是服务器从他的文件系统中检索到该对象。插入到响应报文并发送响应报文的时间。 

Server:首部行 表明该报文是由一个什么服务器产生的,类似于请求报文中的User-agent:首部行 . 

Last-Modified:首部行 表示对象创建会最后修改的日期和时间,这个首部行对可能在客户机也可能在网络缓存服务器上的对象缓存很重要。 

Content-Length:首部行 表明被发送对象的字节数。 

Content-Type:首部行 指示了实体主体中的对象时什么类型的文本如HTML文本,JSON对象文本

————— 下面看看请求报文通用格式—– – 

HTTP協定封包格式

 

一些常见的状态码相关短语: 

200 OK :请求成功,信息包含在返回的响应报文中 

301 Moved Permanently:请求的对象已经被永久被转移了,新的URL定义在响应报文的Location:首部行 中定义。客户机自动用新的URL获取对象。 

400 Bad Request:一个通用差错代码,请求不能服务器理解 

404 Not Found:被请求的文档不在服务器上 

505 HTTP Version Not Supported:服务器不支持请求报文使用的HTTP版本

关于HTTP请求GET和POST的区别

 

1.GET提交,请求的数据会附在URL之后(就是把数据放置在HTTP协议头<request-line>中),以?分割URL和传输数据,多个参数用&连接;例如:login.action?name=hyddd&password=idontknow&verify=%E4%BD%A0 %E5%A5%BD。如果数据是英文字母/数字,原样发送,如果是空格,转换为+,如果是中文/其他字符,则直接把字符串用BASE64加密,得出如: %E4%BD%A0%E5%A5%BD,其中%XX中的XX为该符号以16进制表示的ASCII。

  POST提交:把提交的数据放置在是HTTP包的包体<request-body>中。上文示例中红色字体标明的就是实际的传输数据

  因此,GET提交的数据会在地址栏中显示出来,而POST提交,地址栏不会改变

 

2.传输数据的大小:

   首先声明,HTTP协议没有对传输的数据大小进行限制,HTTP协议规范也没有对URL长度进行限制。 而在实际开发中存在的限制主要有:

   GET:特定浏览器和服务器对URL长度有限制,例如IE对URL长度的限制是2083字节(2K+35)。对于其他浏览器,如Netscape、FireFox等,理论上没有长度限制,其限制取决于操作系统的支持。

   因此对于GET提交时,传输数据就会受到URL长度的限制。

   POST:由于不是通过URL传值,理论上数据不受限。但实际各个WEB服务器会规定对post提交数据大小进行限制,Apache、IIS6都有各自的配置。

 

3.安全性:

    POST的安全性要比GET的安全性高。注意:这里所说的安全性和上面GET提到的“安全”不是同个概念。上面“安全”的含义仅仅是不作数据修改,而这里安全的含义是真正的Security的含义,比如:通过GET提交数据,用户名和密码将明文出现在URL上,因为(1)登录页面有可能被浏览器缓存, (2)其他人查看浏览器的历史纪录,那么别人就可以拿到你的账号和密码了,

https://blog.csdn.net/qq_26927285/article/details/54427482