HTTP协议
超文本传输协议(HyperText Transfer Protocol),缩写HTTP。通过HTTP或者HTTPS协议请求的资源由统一资源标识符(Uniform Resource Identifiers,URI)来标识。由HTTP客户端发起一个请求,创建一个到服务器指定端口(默认是80端口)的TCP连接。HTTP服务器则在那个端口监听客户端的请求。一旦收到请求,服务器会向客户端返回一个状态,比如"HTTP/1.1 200 OK",以及返回的内容,如请求的文件、错误消息、或者其它信息。
URI和URL
-
URI:Uniform Resource Identifier,统一资源标识符
Web上可用的每种资源如HTML文档、图像、视频片段、程序等都是用URI来定位的;
URI一般由三部分组成:
- 访问资源的命名机制
- 存放资源的主机名
- 资源自身的名称,由路径表示,着重强调于资源
-
URL:Uniform Resource Location,统一资源定位符
URL是Internet上用来描述信息资源的字符串,主要用在各种WWW客户程序和服务器程序上。URL是URI的一种。
采用URL可以用一种统一的格式来描述各种信息资源,包括文件、服务器的地址和目录等。
URL一般由三部组成
- 协议
- 可访问该资源的主机IP地址(或带有端口号)
- 主机资源的具体地址(目录加文件名)
URL的构成:
- 协议部分:协议部分为http:
- 域名部分:域名部分例如"www.greatytc.com",当然域名也可以用IP地址,IP少一步用DNS服务器解析
- 端口部分:域名和端口之间使用":"分隔。端口不是URL必须的部分,如果端口省略,将采用默认端口号80,所以实际请求地址是//www.greatytc.com/:80
4.虚拟目录部分:从域名后的第一个“/”开始到最后一个“/”为止,是虚拟目录部分。虚拟目录也不是一个URL必须的部分。 - 文件名部分:指在服务器中访问的资源文件的路径。
- 锚部分:从“#”开始到最后,都是锚部分,也不是必须的部分。做过html的都知道,用于定位到页面的滑动位置。
- 参数部分:从“?”开始到“#”为止之间的部分为参数部分,又称搜索部分、查询部分。例如?page=1。
请求的种类:
HTTP协议中共定义了八种方法或者叫“动作”来表明对Request-URI指定的资源的不同操作方式。就类似操作数据库和文件系统一样,设计网络的请求也是一样。URL用于定位了网络资源,创造PUT,DELETE,POST,GET来对应增,删,改,查操作。但是我们在实际应用中常用的也就是get和post,其他请求方式也都可以通过这两种方式间接的来实现。
GET
向指定资源发出“显示“信息。使用GET方法只用于获取数据,而不应该改变数据本身,即不对数据进行操作和提交信息。POST
向指定资源提交数据,请求服务器进行处理(例如提交参数/表单,或者上传文件)。可能会对数据进行操作和提交信心,创建资源。PUT
向指定资源位置上传其最新内容。DELETE
顾名思义,请求服务器删除URI所对应的资源。HEAD
与GET方法一样,都是向服务器发出指定资源的请求。只不过服务器将不传回资源的本文部分。它的好处在于,使用这个方法可以在不必传输全部内容的情况下,就可以获取其中“关于该资源的信息”(元信息或称元数据)。TRACE
回显服务器收到的请求,主要用于测试或诊断。OPTIONS
这个方法可使服务器传回该资源所支持的所有HTTP请求方法。用'*'来代替资源名称,向Web服务器发送OPTIONS请求,可以测试服务器功能是否正常运作。CONNECT
HTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器。通常用于SSL加密服务器的链接(经由非加密的HTTP代理服务器)。
GET和POST的区别:
参数携带位置不同。
GET提交的数据会附加家URL之后(即把数据放在请求行中),会在地址栏中显示,接?=传值,多个参数用&连接。POST提交的数据放在HTTP包体中,地址栏不显示。传输数据大小限制不同。
不同浏览器对URL的长度有限制,因此对于GET提交时,传输数据就会受到URL长度的限制。POST由于不是通过URL传值,理论上数据不受限。POST的安全性要比GET的安全性高。因为浏览器可能对请求地址做历史记录的存储,对于GET请求的登录,那其他人就可以直接在URL上拿到你的账号和密码了,而POST拿不到参数。
HTTP请求信息:
客户端发送一个HTTP请求到服务的请求信息包括以下格式:
请求行(request line)、请求头(header,常用于存放token)、空行和请求数据四个部分。
例如:
GET /8669504-c2641e8e6eed5904.png HTTP/1.1
Host www.greatytc.com
User-Agent Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36
Accept image/webp,image/,/*;q=0.8
Referer www.greatytc.com
Accept-Encoding gzip, deflate, sdch
Accept-Language zh-CN,zh;q=0.8
name=Professional%20Ajax&publisher=lili
- 第一行请求行,用来说明请求类型,要访问的资源以及所使用的HTTP版本。
- 第二部分,大括号之间的请求头部,用于提交服务器的附加信息。
- 第三部分,空行,请求头部后面的空行是必须的。
- 第四部分,请求数据也叫主体,可以添加任意的其他数据。
HTTP响应信息:
服务器接受请求回传响应信息也由四分部组成:
状态行,消息报头,空行和响应正文。
例如:
HTTP/1.1 200 OK
Date: Fri, 22 May 2017 06:07:21 GMT
Content-Type: text/html; charset=UTF-8
<html>
<head></head>
<body>
</body>
</html>
- 第一行包括协议版本号,返回状态码
- 第二行为响应日期时间
- 第三行为响应消息报头,Content-Type:指定了MIME类型的HTML(text/html),编码类型是UTF-8
- 响应正文,服务器返回给客户端的文本信息。
HTTP状态码:
状态码有三位数字,第一数字表示当前相应的类型,各个类型有:
- 1xx消息——请求已被服务器接受,继续处理
- 2xx成功——请求已成功被服务器接收(如见到就像亲人的200,201)
- 3xx重定向——需要后续操作才能完成这一请求
- 4xx请求错误——客户端错误:请求含有词法错误或无法被执行(如见到就想暴走的404 Not Found)
- 5xx服务器错误——服务端错误:服务器在处理某个正确请求时发生错误(如一见到就想找后台的500)
常见的状态码如下:
200 OK:客户端请求成功
400 Bad Request:客户端请求有语法错误,不能被服务器所理解
401 Unauthorized:请求未经授权,这个状态代码必须和WWW-Authenticate报头域一起使用
403 Forbidden:服务器收到请求,但是拒绝提供服务
500 Internal Server Error:服务器发生不可预期的错误
503 Server Unavailable:服务器当前不能处理客户端的请求,一段时间后可能恢复正常
总结HTTP一次请求的完整过程:
- 客户端与服务端建立TCP连接
- 通过TCP套接字连接,发送HTTP请求
- 服务器解析请求,定位请求资源,将查询资源然后返回HTML文本数据,由客户端读取。
- 释放TCP连接
5.客户端浏览器解析HTML内容
浏览器输入网站发生的事件:
1、浏览器向 DNS 服务器请求解析该 URL 中的域名所对应的 IP 地址;
2、解析出 IP 地址后,根据该 IP 地址和默认端口 80,和服务器建立TCP连接;
3、浏览器发出读取文件(URL 中域名后面部分对应的文件)的HTTP 请求,该请求报文作为 TCP 三次握手的第三个报文的数据发送给服务器;
4、服务器对浏览器请求作出响应,并把对应的 html 文本发送给浏览器;
5、释放 TCP连接;
6、浏览器将该 html 文本并显示内容;
Http各版本特性有哪些:
HTTP 1.0
特点:
1.引入请求头和响应头(数据类型、语言版本、编码类型、用户代理);
2.数据压缩;
3.引入状态码;
4.提供了Cache缓存机制(head里的缓存头:If-Modified-Since、Expires)。
瓶颈:
仅支持短连接,对于包含多个请求的文件,会大大增加开销;
串行文件传输,一个请求没有及时返回,会引起队头阻塞;
一个服务器仅支持一个域名;
因为在响应头中需要指定数据大小,因此无法接收动态生成的数据;
服务器只能传递完整的数据,而不能满足“只想要数据的一部分”这样的需求,会导致带宽浪费;
不支持断点续传。
每次数据传输,在TCP建立连接时,三次握手都会有1.5个RTT(round-trip time)的延迟。
HTTP 1.1
特点:
1.支持持久连接,一次连接可以发送多个请求和响应(最多6个)
2.引入虚拟主机技术,让一个服务器可以支持多个域名;
3.引入Cookie与安全机制;
4.引入range头域,可以只请求资源的一部分(状态码206);
5.优化缓存策略(在head中,增加Etag、If-Unmodified-Since、If-Match、If-None-Match等缓存头);
6.增加错误状态码。
HTTP 2.0
1.使用多路复用技术,一个连接可以发送多个请求;
2.可以设置请求优先级;
3.借助专门为首部压缩设计的HPACK 算法进行首部压缩。
HTTP2.0多路复用有多好?
HTTP 性能优化的关键并不在于高带宽,而是低延迟。TCP 连接会随着时间进行自我「调谐」,起初会限制连接的最大速度,如果数据成功传输,会随着时间的推移提高传输的速度。这种调谐则被称为 TCP 慢启动。由于这种原因,让原本就具有突发性和短时性的 HTTP 连接变的十分低效。
HTTP/2 通过让所有数据流共用同一个连接,可以更有效地使用 TCP 连接,让高带宽也能真正的服务于 HTTP 的性能提升。
HTTP 3.0
特点:
1.基于UDP
2.实现了多路复用;
3.实现了流量控制、可靠传输;
4.实现了快速握手。
瓶颈:
兼容性尚不完整;
优化程度不高。
参考:
https://blog.csdn.net/qq_44647809/article/details/120570572
https://zhuanlan.zhihu.com/p/342311013