菜鸟面试必知的 http 知识(三)—— 请求和响应报文

篇3介绍了HTTP的请求报文和响应报文,重点是请求方法和状态码(我在面试阿里和腾讯分别被问到过),这其实就是HTTP协议的核心了!

用于HTTP协议交互的信息被称为HTTP报文。请求端的HTTP报文叫做请求报文,响应端的叫做响应报文。HTTP报文大致可分为报文首部报文主体两块,如图1所示。

图1 - 请求报文和响应报文的结构

请求报文和响应报文主要不同在于报文首部分别是请求行和状态行,其含义如下:

  • 请求行:包含用于请求的方法,请求URI和HTTP版本
  • 状态行:包含表明响应结果的状态码,原因短语和HTTP版本
  • 首部字段:包含表示请求和响应的各种条件和属性的各类首部

下面以请求简书博客地址为例,解释请求报文和响应报文

1 - 请求报文

请求报文是由请求方法、请求URI、协议版本、可选的请求首部字段和内容实体组成的。

// 请求报文
GET //www.greatytc.com/u/d97a1dec9e2d   HTTP/1.1

// 请求首部字段
Host: www.greatytc.com
Proxy-Connection: keep-alive
Accept: application/json
Chrome/57.0.2979.2 Safari/537.36
Referer: //www.greatytc.com/u/d97a1dec9e2d
Accept-Encoding: gzip, deflate, sdch
Accept-Language: zh-CN,zh;q=0.8

// 内容实体
Cookie: ...
name=binjiang&age=100

1.1 - HTTP请求方法

(1). GET:获取资源
 GET方法用来请求访问已被URI识别的资源,指定的资源经服务端解析后返回响应内容。如果资源是文本、图片,就直接返回;如果是接口程序,就返回执行的结果。

(2). POST:传输实体主体
 POST方法用来传输实体的主体,尽管GET方法也可以传输实体的主体,但一般不用GET方法进行传输,而是POST方法。

这是因为GET提交,请求的数据会附在URI之后,而POST提交会把请求的数据放置在内容实体中。因此,GET提交的数据会在地址栏中显示出来,而POST提交,地址栏不会改变。
 同时,GET方法在特定浏览器和服务器对URL长度有限制,这也会导致POST可以传输的内容更多一些。并且POST的安全性要比GET的安全性高。

(3). PUT:传输文件
 PUT方法用来传输文件。但是鉴于HTTP/1.1的PUT方法自身不带验证机制,任何人都可以上传文件,存在安全性,因此一般的web网站不使用该方法。除非配合web应用程序的验证机制或是采用REST标准的网站架构设计。

(4). HEAD:获得报文首部
 HEAD方法和GET方法一样,只是不返回报文主体部分。用于确认URI的有效性及资源更新的日期时间等。

(5). DELETE:删除文件
 DELETE方法用来删除文件,是与PUT相反的方法。同样HTTP/1.1的DELETE方法自身不带验证机制,因此一般的web网站不使用该方法。

(6). OPTIONS:询问支持的方法
 OPTIONS方法用来查询针对URI指定的资源支持的方法。

(7). TRACE:追踪路径
 TRACE方法是让web服务器端将之前的请求通信环回给客户端的方法。客户端通过TRACE方法可以查询发送出去的请求是怎样被加工修改/篡改的。这是因为,请求在连接到目标服务器的中途可能会经过代理中转,TRACE方法就是用来确认连接过程中发生的一系列操作。

(8). CONNECT:要求用隧道协议连接代理
 CONNECT方法要求在与代理服务器通信时建立隧道,实现用隧道协议进行TCP通信。主要使用SSL(Secure Sockets Layer,安全套接层)和TSL(Transport Layer Security,传输层安全)协议把通信内容加密后经网络隧道传输


2 - 响应报文

响应报文是由协议版本、状态码、说明、可选响应首部字段以及实体主体构成。

HTTP/1.1    200    OK
// 响应首部字段
Date: Mon, 13 Mar 2017 04:36:45 GMT
Content-Length: 362
Content-Type: text/html
// 主体
<html>
...

2.1 - HTTP状态码

状态码的作用是当客户端向服务端发送请求后,服务端返回处理结果的状态。因为客户端需要知道服务端返回的是有效的还是错误的数据,如果是错误的数据,是客户端的问题,还是服务端的问题。

类别 原因短语
1XX Informational(信息性状态码) 请求正在处理中
2XX Success 正常处理完毕
3XX Redirection 需要进行附加操作才算完成请求
4XX Client Error 客户端发送的请求数据问题
5XX Server Error 服务端处理请求时出错

这里面最需要关注的是4XX和5XX。因为在Web开发和调试过程中,不可避免会出现Bug,返回码可以帮助快速定位到出错点。例如经常会出现的“404 Not Found”错误,表明了服务器上无法找到请求的资源,而服务器本身是正常工作的。“501 Internal Server Error”表明服务器端在执行请求时发生了错误,此时服务器并没有正常工作。


3 - 首部字段含义

  • 通用首部字段(General Header Fields): 请求报文和响应报文两方都会使用的首部;
  • 请求首部字段(Request Header Fields): 从客户端向服务器发送请求报文时使用的首部。补充了请求的附加内容,客户端的信息,响应内容相关的优先级等信息。
  • 响应首部字段(Response Header Fields): 从服务器向客户端返回响应报文时使用的首部。补充了响应的附加内容,也会要求客户端附加额外的内容信息。
  • 实体首部字段(Entity Header Fields): 针对请求报文和响应报文的实体部分使用的首部。补充了资源内容更新时间等与实体有关的信息。
3.1 - 通用首部字段
首部字段名 说明
Cache-Control 控制缓存的行为
Connection 逐跳首部,连接的管理
Date 创建报文的日期时间
Pragna 报文指令
Trailer 报文末端的首部一览
Transfer-Encoding 指定报文主体的传输编码方式
Upgrade 升级为其他协议
Via 代理服务器的相关信息
Warning 错误通知
3.2 - 请求首部字段
首部字段名 说明
Accept 用户代理可处理的媒体类型
Accept—Charset 优先的字符集
Accept-Encoding 优先的内容编码
Accept-Language 优先的语言(自然语言)
Authorization Web认证信息
Expect 期待服务器的指定行为
From 用户的电子邮箱地址
Host 请求资源所在服务器
if-Match 比较实体标记(ETag)
if-Modified-Since 比较资源的更新时间
if-None-Match 比较实体标记(与if-Match相反)
if-Range 资源为更新时发送实体Byte的范围请求
if-Unmodified-Since 比较资源的更新时间(与if-Modified-Since相反)
Max-Forwards 最大传输逐跳数
Proxy-Authorization 代理服务器要求客户端的认证信息
Range 实体字节范围请求
Referer 对请求中的URL的原始获取方法
TE 传输编码的优先级
User-Agent HTTP客户端程序的信息
3.3 - 响应首部字段
首部字段名 说明
Accept-Ranges 是否接受字节范围请求
Age 推算资源创建经过时间
ETag 资源的匹配信息
Location 令客户端重定向至指定的URL
Proxy-Authenticate 代理服务器对客户端的认证信息
Rety-After 对再次发起请求的时机要求
Server HTTP服务器的安装信息
Vary 代理服务器缓存的管理信息
WWW-Authenticate 服务器对客户端的认证信息
3.4 - 实体首部字段
首部字段名 说明
Allow 资源科支持的HTTP方法
Content-Encoding 实体主体适用的编码方式
Content-Language 实体主体的自然语言
Content-Length 实体主体的大小(单位:字节)
Content-Location 替代对资源的URL
Content-MD5 实体主体的报文摘要
Content-Range 实体主体的位置范围
Content-Type 实体主体的媒体类型
Expires 实体主体过期的日期时间
Last-Modified 资源的最后修改日期时间

4 - Cookie服务的首部字段

首部字段名 说明 首部类型
Set-Cookie 开始状态管理所有的Cookie信息 响应首部字段
Cookie 服务器接收到的Cookie信息 请求首部字段
4.1 - Set-Cookie字段的属性
属性 说明
NAME=VALUE 赋予Cookie的名称和其值
expires=DATE Cookie的有效期(若不mingque指定则默认为浏览器关闭前为止)
path=PATH 将服务器上的文件目录作为Cookie的适用对象(若不指定则默认为文档所在的目录)
domain=域名 作为Cookie适用对象的域名(若不指定则默认为创建Cookie的服务器的域名)
Scure 仅在HTTPS安全通信时才会发送Cookie
HttpOnly 加以限制,使Cookie不能被JavaScript脚本访问

大家好,我是彬彬酱,目前在腾讯从事Web后端开发。
菜鸟必知的 http 知识专题整理了关于网络的基础知识,适合大家进行入门级学习,这个专题现包含下列文章:
菜鸟必知的 http 知识(一)—— TCP 握手协议
菜鸟必知的 http 知识(二)—— HTTP 协议特点
菜鸟必知的 http 知识(三)—— 请求和响应报文
菜鸟必知的 http 知识(四)—— HTTP 和 HTTPS
菜鸟必知的 http 知识(五)—— 新技术的出现
菜鸟必知的 http 知识(六)—— web的结构组件


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容