摘要:本文主要介绍HTTP的最基本的知识,包括request请求、response响应、常见的响应状态码、GET请求与POST请求的区别。
一、HTTP 请求
1. http请求操作/curl命令
-
curl -s -v -H "Frank: xxx" -- "https://www.baidu.com"//GET获取操作
请求内容
GET / HTTP/1.1
Host: www.baidu.com
User-Agent: curl/7.54.0
Accept: */*
Frank: xxx
-
curl -X POST -s -v -H "Frank: xxx" -- "https://www.baidu.com"//POST上传操作
请求内容
POST / HTTP/1.1
Host: www.baidu.com
User-Agent: curl/7.54.0
Accept: */*
Frank: xxx
-
curl -X POST -d "1234567890" -s -v -H "Frank: xxx" -- "https://www.baidu.com"//POST上传带数据
请求内容
POST / HTTP/1.1
Host: www.baidu.com
User-Agent: curl/7.54.0
Accept: */*
yyy: xxx
Content-Length: 10
Content-Type: application/x-www-form-urlencoded
1234567890
注:第二部分中,至少需要有Host
、Content-Length
、Content-Type
2. 综上所得,请求一共包含以下部分
1 动词 路径 协议/版本
2 Key1: value1
2 Key2: value2
2 Key3: value3
2 Content-Type: application/x-www-form-urlencoded
2 Host: www.baidu.com
2 User-Agent: curl/7.54.0
3
4 要上传的数据-
其中需要注意的是:
- 请求最多包含四部分,最少包含三部分,即第四部分数据可以为空。
- 第三部分永远都是一个回车,用来分隔第二、第四部分。
- 第一部分的动词包括
GET
(获取)/POST
(上传,新增)/PUT
(整体更新)/PATCH
(局部更新)/DELETE
(删除)/HEAD
(获取资源的元数据)/OPTIONS
(获取信息,关于资源的哪些属性是客户端可以改变的)等。 - 如果没有写路径,则默认为根目录(即
/
) - 第二部分中的的 Content-Type 标注了第 4 部分的格式
- 第一部分的路径,包含查询参数,但不包括锚点
3. 使用Chrome浏览器查看http请求
- 打开 控制台中的Network面板
- 地址栏输入网址
- 在 Network 点击,查看 request,点击「view source」
- 如果有请求的第四部分,那么在 FormData 或 Payload 里面可以看到
举例说明(百度首页请求):
二、HTTP 响应
1.http响应出现在请求结束后
如curl -s -v -H "Frank: xxx" -- "https://www.baidu.com"//GET获取操作
获得的响应代码为:
HTTP/1.1 200 OK
Accept-Ranges: bytes
Cache-Control: private, no-cache, no-store, proxy-revalidate, no-transform
Connection: Keep-Alive
Content-Length: 2443
Content-Type: text/html
Date: Tue, 10 Oct 2017 09:14:05 GMT
Etag: "5886041d-98b"
Last-Modified: Mon, 23 Jan 2017 13:24:45 GMT
Pragma: no-cache
Server: bfe/1.0.8.18
Set-Cookie: BDORZ=27315; max-age=86400; domain=.baidu.com; path=/
<!DOCTYPE html>
<html lang="en">
………………以下为网页html代码,略…………
</html>
2. http响应包含以下部分
- 1 协议/版本号 状态码 状态解释
2 Key1: value1
2 Key2: value2
2 Content-Length: 17931
2 Content-Type: text/html
3
4 要下载的内容 -
其中需要注意的是
第 2 部分中的 Content-Type 标注了第 4 部分的格式
第 2 部分中的 Content-Type 遵循 MIME 规范
第一部分的状态解释没什么用
3. 关于响应的状态码
1xx消息:代表请求已被接受,需要继续处理。这类响应是临时响应,只包含状态行和某些可选的响应头信息,并以空行结束。(不常用,大致知道即可)
-
2XX:表示成功
- 200 OK:请求已成功,请求所希望的响应头或数据体将随此响应返回。
- 204 No Content:表示请求已成功处理,但是没有内容返回,意思等同于请求执行成功,但是没有数据,浏览器不用刷新页面,也不用导向新的页面。
- 206 Partial Content:服务器已经成功处理了部分GET请求。(客户端进行了范围请求) 响应报文中包含Content-Range指定范围的实体内容。
-
3XX:重定向
- 301 Moved Permanently:表示访问的资源被永久移除,即请求的资源已经永久的搬到了其他位置 。
- 302 Found :表示所访问的资源临时被移除,以后还会回来,即临时重定向,表示请求的资源临时搬到了其他位置 。
- 303 See Other :表示请求资源存在另一个URI,应使用GET定向获取请求资源 。
- 304 Not Modified :表示资源未被修改,即客户端仍然具有以前下载的副本,不需要重新传输资源。
- 307 Temporary Redirect:临时重定向,和302有着相同含义 ,尽管302标准禁止POST变为GET,但没人听他的 ,而307就会遵照标准,不会从POST变为GET
但处理响应行为,各个浏览器可能不同。
-
4XX:客户端错误
- 400 Bad Request:表示请求报文存在语法错误或参数错误,服务器不理解 ,服务器不应该重复提交这个请求 ,需要修改请求内容后再次发送。
- 401 Unauthorized:表示发送的请求需要有HTTP认证信息或者是认证失败了 ,返回401的响应必须包含一个适用于被请求资源的WWW-Authenticate首部以质询用户信息 ,浏览器初次接受401时,会弹出认证窗口。
- 403 Forbidden :表示对请求资源的访问被服务器拒绝了 ,服务器可以对此作出解释,也可以不解释 ,想说明的话可以在响应实体的主体部分描述原因 。比如说你可能没有访问权限。
- 404 Not Found:表示服务器找不到你请求的资源 ,但允许用户的后续请求。
-
5XX:服务器错误
- 500 Internal Server Error:通用错误消息,服务器遇到了一个未曾预料的状况,导致了它无法完成对请求的处理。没有给出具体错误信息。
- 502 Bad Gateway:作为网关或者代理工作的服务器尝试执行请求时,从上游服务器接收到无效的响应。
- 503 Service Unavailable:表示服务器超负载或正停机维护,无法处理请求 ,如果服务器知道还需要多长时间,就写入Retry-After首部字段返回。
4. 使用Chrome浏览器查看http响应
- 打开 Network
- 输入网址
- 选中第一个响应
- 查看 Response Headers,点击「view source」
- 你会看到响应的前两部分
- 查看 Response 或者 Preview,你会看到响应的第 4 部分
举个例子:百度首页响应代码
三、GET 和 POST 的区别是什么
这是一个很常见的面试题,我这里总结的答案是:
- 参数。GET 的参数放在 url 的查询参数里,POST 的参数(数据)放在请求消息体里。
-
安全。GET 没有 POST 安全(当然实际上二者都没有那么的安全)。因为GET请求很容易伪造(比如
<a>
、<img>
、<link>
、<script>
、<form>
标签都可以发送GET请求)。 - 数据长度。GET 的参数(url查询参数)有长度限制,一般是 1024 个字符。POST 的参数(数据)没有长度限制(话虽这么说,但实际POST还是有4~10Mb 的限制,但是相对于GET已经大多了)
- 包。GET 请求只需要发一个包,POST 请求需要发两个以上包(因为 POST 有消息体)(虽然GET 也可以用消息体但是不常用)
- 作用。GET 用来读数据,POST 用来写数据,POST 不幂等(幂等的意思就是不管发多少次请求,结果都一样。)