为什么把连接管理单独写出来呢?三次握手四次挥手,相信都已经很耳熟能详了。但是过程发生了什么?到底是如何发生的?持久连接又是如何断开的?
建立连接过程
URL解析:第 (1) ~ (3) 步会将服务器的 IP 地址和端口号从 URL 中分离出来。
(4) 步中建立到 Web 服务器的 TCP 连接
(5) 步通过这条连接发送一条请求报文
(6) 步读取响应
(7) 步关闭连接。
TCP流是分段的、由IP分组传送
TCP/IP协议簇是一组不同层次上的多个协议的组合,通常被认为是一个四层协议系统,与OSI的七层模型相对应。
HTTP over TCP over IP
HTTP 要传送一条报文时,会以流的形式将报文数据的内容通过一条打开的 TCP 连 接按序传输。TCP 收到数据流之后,会将数据流砍成被称作段的小数据块,并将段 封装在 IP 分组中,通过因特网进行传输。
3次握手和4次挥手 ——TCP连接的建立和断开
3次握手
说到http连接,就跳不过连接的建立和断开,三次握手也算是说得频繁的一个点了,其实断开跟建立一样重要。
首先说三次握手
1.首先,客户端会发送一个小的TCP分组,带有SYN标记,说明是一个连接请求。
2.服务端接受连接,则进行一些计算,将SYN和ACK位数据置位发送响应,表示接受连接请求。
3.客户端再回送一条数据来表示连接已经建立。
建立连接,接着就可以请求数据了。
持久连接
在事务处理结束之后仍然保持在打开状态的 TCP 连接被称为持久连接。
一个页面需要请求的文件一般都很多,总不能每一个文件都从头建立一次TCP连接,仅仅握手时延就是很大的消耗。还有各种慢启动等问题。
所以持久连接是很必须的,http1.0有keep-alive,到了1.1就是默认支持了。
持久连接需要清楚的是,客户端是无法知道响应的文件是否已经传输完毕从而发起下一个请求的,所以content-length字段(文件内容长)就显得尤为重要。
在事务处理完毕之后,需要断开连接。
然而,持久连接是怎么知道该什么时候断开连接呢?
4次挥手
什么时候数据请求完不再需要,那就是断开连接的时候。妈的,这不是废话嘛~
怎么知道不再请求?
TCP 连接是双向的。TCP 连接的每一端都有一个输入队列和一个 输出队列,用于数据的读或写。放入一端输出队列中的数据最终会出现在另一端的 输入队列中。
由于TCP连接是全双工的,因此每个方向都必须单独进行关闭。这原则是当一方完成它的数据发送任务后就能发送一个FIN来终止这个方向的连接。收到一个 FIN只意味着这一方向上没有数据流动,一个TCP连接在收到一个FIN后仍能发送数据。首先进行关闭的一方将执行主动关闭,而另一方执行被动关闭。
(1) 第一次: TCP客户端发送一个FIN,连同最后的一个请求,用来关闭客户到服务器的数据传送。FIN-WAIT
(2) 第二次: 服务器收到这个FIN,它发回一个ACK和文件,客户端接受文件无误,继续等待服务器发来的FIN关闭通知。
在这之后,服务器关闭队列,做好关闭连接的准备,确认序号为收到的序号加1。和SYN一样,一个FIN将占用一个序号。WAIT CLOSE。准备好。发送FIN关闭连接信息。
(4) 第三次: 接收FIN,第四次: 回复一个ACK,告诉服务器可以关闭了。然后开始倒计时状态TIME-WAIT