篇3介绍了HTTP的请求报文和响应报文,重点是请求方法和状态码(我在面试阿里和腾讯分别被问到过),这其实就是HTTP协议的核心了!
用于HTTP协议交互的信息被称为HTTP报文。请求端的HTTP报文叫做请求报文,响应端的叫做响应报文。HTTP报文大致可分为报文首部和报文主体两块,如图1所示。
请求报文和响应报文主要不同在于报文首部分别是请求行和状态行,其含义如下:
- 请求行:包含用于请求的方法,请求URI和HTTP版本
- 状态行:包含表明响应结果的状态码,原因短语和HTTP版本
- 首部字段:包含表示请求和响应的各种条件和属性的各类首部
下面以请求简书博客地址为例,解释请求报文和响应报文
1 - 请求报文
请求报文是由请求方法、请求URI、协议版本、可选的请求首部字段和内容实体组成的。
// 请求报文
GET //www.greatytc.com/u/d97a1dec9e2d HTTP/1.1
// 请求首部字段
Host: www.greatytc.com
Proxy-Connection: keep-alive
Accept: application/json
Chrome/57.0.2979.2 Safari/537.36
Referer: //www.greatytc.com/u/d97a1dec9e2d
Accept-Encoding: gzip, deflate, sdch
Accept-Language: zh-CN,zh;q=0.8
// 内容实体
Cookie: ...
name=binjiang&age=100
- “GET”:请求方法
- “www.greatytc.com/u/d97a1dec9e2d”:请求URI
- “HTTP/1.1”:协议版本
1.1 - HTTP请求方法
(1). GET:获取资源
GET方法用来请求访问已被URI识别的资源,指定的资源经服务端解析后返回响应内容。如果资源是文本、图片,就直接返回;如果是接口程序,就返回执行的结果。
(2). POST:传输实体主体
POST方法用来传输实体的主体,尽管GET方法也可以传输实体的主体,但一般不用GET方法进行传输,而是POST方法。
这是因为GET提交,请求的数据会附在URI之后,而POST提交会把请求的数据放置在内容实体中。因此,GET提交的数据会在地址栏中显示出来,而POST提交,地址栏不会改变。
同时,GET方法在特定浏览器和服务器对URL长度有限制,这也会导致POST可以传输的内容更多一些。并且POST的安全性要比GET的安全性高。
(3). PUT:传输文件
PUT方法用来传输文件。但是鉴于HTTP/1.1的PUT方法自身不带验证机制,任何人都可以上传文件,存在安全性,因此一般的web网站不使用该方法。除非配合web应用程序的验证机制或是采用REST标准的网站架构设计。
(4). HEAD:获得报文首部
HEAD方法和GET方法一样,只是不返回报文主体部分。用于确认URI的有效性及资源更新的日期时间等。
(5). DELETE:删除文件
DELETE方法用来删除文件,是与PUT相反的方法。同样HTTP/1.1的DELETE方法自身不带验证机制,因此一般的web网站不使用该方法。
(6). OPTIONS:询问支持的方法
OPTIONS方法用来查询针对URI指定的资源支持的方法。
(7). TRACE:追踪路径
TRACE方法是让web服务器端将之前的请求通信环回给客户端的方法。客户端通过TRACE方法可以查询发送出去的请求是怎样被加工修改/篡改的。这是因为,请求在连接到目标服务器的中途可能会经过代理中转,TRACE方法就是用来确认连接过程中发生的一系列操作。
(8). CONNECT:要求用隧道协议连接代理
CONNECT方法要求在与代理服务器通信时建立隧道,实现用隧道协议进行TCP通信。主要使用SSL(Secure Sockets Layer,安全套接层)和TSL(Transport Layer Security,传输层安全)协议把通信内容加密后经网络隧道传输
2 - 响应报文
响应报文是由协议版本、状态码、说明、可选响应首部字段以及实体主体构成。
HTTP/1.1 200 OK
// 响应首部字段
Date: Mon, 13 Mar 2017 04:36:45 GMT
Content-Length: 362
Content-Type: text/html
// 主体
<html>
...
2.1 - HTTP状态码
状态码的作用是当客户端向服务端发送请求后,服务端返回处理结果的状态。因为客户端需要知道服务端返回的是有效的还是错误的数据,如果是错误的数据,是客户端的问题,还是服务端的问题。
类别 | 原因短语 | |
---|---|---|
1XX | Informational(信息性状态码) | 请求正在处理中 |
2XX | Success | 正常处理完毕 |
3XX | Redirection | 需要进行附加操作才算完成请求 |
4XX | Client Error | 客户端发送的请求数据问题 |
5XX | Server Error | 服务端处理请求时出错 |
这里面最需要关注的是4XX和5XX。因为在Web开发和调试过程中,不可避免会出现Bug,返回码可以帮助快速定位到出错点。例如经常会出现的“404 Not Found”错误,表明了服务器上无法找到请求的资源,而服务器本身是正常工作的。“501 Internal Server Error”表明服务器端在执行请求时发生了错误,此时服务器并没有正常工作。
3 - 首部字段含义
- 通用首部字段(General Header Fields): 请求报文和响应报文两方都会使用的首部;
- 请求首部字段(Request Header Fields): 从客户端向服务器发送请求报文时使用的首部。补充了请求的附加内容,客户端的信息,响应内容相关的优先级等信息。
- 响应首部字段(Response Header Fields): 从服务器向客户端返回响应报文时使用的首部。补充了响应的附加内容,也会要求客户端附加额外的内容信息。
- 实体首部字段(Entity Header Fields): 针对请求报文和响应报文的实体部分使用的首部。补充了资源内容更新时间等与实体有关的信息。
3.1 - 通用首部字段
首部字段名 | 说明 |
---|---|
Cache-Control | 控制缓存的行为 |
Connection | 逐跳首部,连接的管理 |
Date | 创建报文的日期时间 |
Pragna | 报文指令 |
Trailer | 报文末端的首部一览 |
Transfer-Encoding | 指定报文主体的传输编码方式 |
Upgrade | 升级为其他协议 |
Via | 代理服务器的相关信息 |
Warning | 错误通知 |
3.2 - 请求首部字段
首部字段名 | 说明 |
---|---|
Accept | 用户代理可处理的媒体类型 |
Accept—Charset | 优先的字符集 |
Accept-Encoding | 优先的内容编码 |
Accept-Language | 优先的语言(自然语言) |
Authorization | Web认证信息 |
Expect | 期待服务器的指定行为 |
From | 用户的电子邮箱地址 |
Host | 请求资源所在服务器 |
if-Match | 比较实体标记(ETag) |
if-Modified-Since | 比较资源的更新时间 |
if-None-Match | 比较实体标记(与if-Match相反) |
if-Range | 资源为更新时发送实体Byte的范围请求 |
if-Unmodified-Since | 比较资源的更新时间(与if-Modified-Since相反) |
Max-Forwards | 最大传输逐跳数 |
Proxy-Authorization | 代理服务器要求客户端的认证信息 |
Range | 实体字节范围请求 |
Referer | 对请求中的URL的原始获取方法 |
TE | 传输编码的优先级 |
User-Agent | HTTP客户端程序的信息 |
3.3 - 响应首部字段
首部字段名 | 说明 |
---|---|
Accept-Ranges | 是否接受字节范围请求 |
Age | 推算资源创建经过时间 |
ETag | 资源的匹配信息 |
Location | 令客户端重定向至指定的URL |
Proxy-Authenticate | 代理服务器对客户端的认证信息 |
Rety-After | 对再次发起请求的时机要求 |
Server | HTTP服务器的安装信息 |
Vary | 代理服务器缓存的管理信息 |
WWW-Authenticate | 服务器对客户端的认证信息 |
3.4 - 实体首部字段
首部字段名 | 说明 |
---|---|
Allow | 资源科支持的HTTP方法 |
Content-Encoding | 实体主体适用的编码方式 |
Content-Language | 实体主体的自然语言 |
Content-Length | 实体主体的大小(单位:字节) |
Content-Location | 替代对资源的URL |
Content-MD5 | 实体主体的报文摘要 |
Content-Range | 实体主体的位置范围 |
Content-Type | 实体主体的媒体类型 |
Expires | 实体主体过期的日期时间 |
Last-Modified | 资源的最后修改日期时间 |
4 - Cookie服务的首部字段
首部字段名 | 说明 | 首部类型 |
---|---|---|
Set-Cookie | 开始状态管理所有的Cookie信息 | 响应首部字段 |
Cookie | 服务器接收到的Cookie信息 | 请求首部字段 |
4.1 - Set-Cookie字段的属性
属性 | 说明 |
---|---|
NAME=VALUE | 赋予Cookie的名称和其值 |
expires=DATE | Cookie的有效期(若不mingque指定则默认为浏览器关闭前为止) |
path=PATH | 将服务器上的文件目录作为Cookie的适用对象(若不指定则默认为文档所在的目录) |
domain=域名 | 作为Cookie适用对象的域名(若不指定则默认为创建Cookie的服务器的域名) |
Scure | 仅在HTTPS安全通信时才会发送Cookie |
HttpOnly | 加以限制,使Cookie不能被JavaScript脚本访问 |
大家好,我是彬彬酱,目前在腾讯从事Web后端开发。
菜鸟必知的 http 知识专题整理了关于网络的基础知识,适合大家进行入门级学习,这个专题现包含下列文章:
菜鸟必知的 http 知识(一)—— TCP 握手协议
菜鸟必知的 http 知识(二)—— HTTP 协议特点
菜鸟必知的 http 知识(三)—— 请求和响应报文
菜鸟必知的 http 知识(四)—— HTTP 和 HTTPS
菜鸟必知的 http 知识(五)—— 新技术的出现
菜鸟必知的 http 知识(六)—— web的结构组件