来自公众号:架构文摘
TCP协议全称为:Transmission Control Protocol
,是一种面向链接、保证数据传输安全、可靠的数据传输协议。为了确保数据的可靠传输,不仅需要对发出的每个字节进行编号确认,还需要验证每一个数据包的有效性。每个TCP数据包是封闭在IP包中的,每个一IP包的后面紧跟着的是TCP头,TCP报文格式如下:
源端口和目的端口字段
TCP源端口(Source Port):源计算机上的应用程序的端口号,占 16 位。
TCP目的端口(Destination Port):目标计算机的应用程序端口号,占 16 位。
序列号字段
CP序列号(Sequence Number):占 32 位。它表示本报文段所发送数据的第一个字节的编号。在 TCP 连接中,所传送的字节流的每一个字节都会按顺序编号。当SYN标记不为1时,这是当前数据分段第一个字母的序列号;如果SYN的值是1时,这个字段的值就是初始序列值(ISN),用于对序列号进行同步。这时,第一个字节的序列号比这个字段的值大1,也就是ISN加1。
确认号字段
TCP 确认号(Acknowledgment Number,ACK Number):占 32 位。它表示接收方期望收到发送方下一个报文段的第一个字节数据的编号。其值是接收计算机即将接收到的下一个序列号,也就是下一个接收到的字节的序列号加1。
数据偏移字段
TCP 首部长度(Header Length):数据偏移是指数据段中的“数据”部分起始处距离 TCP 数据段起始处的字节偏移量,占 4 位。其实这里的“数据偏移”也是在确定 TCP 数据段头部分的长度,告诉接收端的应用程序,数据从何处开始。
保留字段
保留(Reserved):占 4 位。为 TCP 将来的发展预留空间,目前必须全部为 0。
标志位字段
CWR(Congestion Window Reduce):拥塞窗口减少标志,用来表明它接收到了设置 ECE 标志的 TCP 包。并且,发送方收到消息之后,通过减小发送窗口的大小来降低发送速率。
ECE(ECN Echo):用来在 TCP 三次握手时表明一个 TCP 端是具备 ECN 功能的。在数据传输过程中,它也用来表明接收到的 TCP 包的 IP 头部的 ECN 被设置为 11,即网络线路拥堵。
URG(Urgent):表示本报文段中发送的数据是否包含紧急数据。URG=1 时表示有紧急数据。当 URG=1 时,后面的紧急指针字段才有效。
ACK:表示前面的确认号字段是否有效。ACK=1 时表示有效。只有当 ACK=1 时,前面的确认号字段才有效。TCP 规定,连接建立后,ACK 必须为 1。
PSH(Push):告诉对方收到该报文段后是否立即把数据推送给上层。如果值为 1,表示应当立即把数据提交给上层,而不是缓存起来。
RST:表示是否重置连接。如果 RST=1,说明 TCP 连接出现了严重错误(如主机崩溃),必须释放连接,然后再重新建立连接。
SYN:在建立连接时使用,用来同步序号。当 SYN=1,ACK=0 时,表示这是一个请求建立连接的报文段;当 SYN=1,ACK=1 时,表示对方同意建立连接。SYN=1 时,说明这是一个请求建立连接或同意建立连接的报文。只有在前两次握手中 SYN 才为 1。
FIN:标记数据是否发送完毕。如果 FIN=1,表示数据已经发送完成,可以释放连接。
窗口大小字段
窗口大小(Window Size):占 16 位。它表示从 Ack Number 开始还可以接收多少字节的数据量,也表示当前接收端的接收窗口还有多少剩余空间。该字段可以用于 TCP 的流量控制。
TCP 校验和字段
校验位(TCP Checksum):占 16 位。它用于确认传输的数据是否有损坏。发送端基于数据内容校验生成一个数值,接收端根据接收的数据校验生成一个值。两个值必须相同,才能证明数据是有效的。如果两个值不同,则丢掉这个数据包。Checksum 是根据伪头 + TCP 头 + TCP 数据三部分进行计算的。
紧急指针字段
紧急指针(Urgent Pointer):仅当前面的 URG 控制位为 1 时才有意义。它指出本数据段中为紧急数据的字节数,占 16 位。当所有紧急数据处理完后,TCP 就会告诉应用程序恢复到正常操作。即使当前窗口大小为 0,也是可以发送紧急数据的,因为紧急数据无须缓存。
可选项字段
选项(Option):长度不定,但长度必须是 32bits 的整数倍。
TCP建立连接
TCP建立连接需要三个步骤,也就是大家熟知的三次握手。下图了正常情形下通过三次握手建立连接的过程:
A机器发出一个数据包
SYN
设置为1,表示希望建立连接。这个包中的假设seq为x
。机器A发送
SYN
数据包后,会进入SYN_SENT
状态B机器收到A发送的
SYN
数据后,响应一个数据包将SYN
和ACK
设置为1,假设这个响应包的序列号为y
,同时期望下一次收到的数据库的序列为x+1
B回复响应包后,进入
SYN_RECD
状态A收到B的响应包后,对响应包做应答将
ACK
标志设置为1,序列号为x + 1
,期望下一次收到的数据包的序列号为y+1
A机器和B机器连接建立成功
TCP三次握手抓包验证
以为验证三次握手是否描述正确,在下使用Wireshark
进行抓包验证。首先使用ping
命令获取www.baidu.com
的ip地址:
正在 Ping www.a.shifen.com [183.232.231.174] 具有 32 字节的数据:
来自 183.232.231.174 的回复: 字节=32 时间=16ms TTL=54
来自 183.232.231.174 的回复: 字节=32 时间=16ms TTL=54
来自 183.232.231.174 的回复: 字节=32 时间=16ms TTL=54
183.232.231.172 的 Ping 统计信息:
数据包: 已发送 = 3,已接收 = 3,丢失 = 0 (0% 丢失),
往返行程的估计时间(以毫秒为单位):
最短 = 16ms,最长 = 16ms,平均 = 16ms
以上输出显示www.baidu.com
的ip地址:183.232.231.174
,然后使用Wireshark
的过滤器仅显示与www.baidu.com
通信的tcp
数据包:
ip.src_host == "183.232.231.174" or ip.dst_host == "183.232.231.174" and tcp
使用Wireshark
抓包分析后,验证TCP正常连接三次握手与上节描述的一致。
为什么是三次握手?
为什么是三次握手?三次握手主要有两个目的:信息对等和防止超时。
信息对等
两台机器通信时都需要确认四个信息:
自己发报文的能力
自己收报文的能力
对方发报文的能力
对方收报文的通知
第一次握手
第一次握手A机器向B机器发送SYN
数据包,此时只有B机器能确认自己收报文的能力和对方发报文的能力。
一次握手完成B机器能够确认的信息有:
√B机器收报文的能力
√A机器发报文的能力
第二次握手
每二次握手后B响应A机器的SYN
数据包,此时A机器就能确认:自己发报文的能力、自己收报文的能力、对方发报文的能力、对方收报文的能力
二次握手完成A机器能够确认的信息有:
√A机器发报文的能力
√A机器收报文的能力
√B机器发报文的能力
√B机器收报文的能力
第三次握手
每三次握手后A应答B机器的SYN + ACK
数据包,此时B机器就能确认:自己发报文的能力、对方收报文的能力
三次握手完成B机器能够确认的信息有:
√B机器发报文的能力
√A机器收报文的能力
至此经过三次握手A、B机器就能做到信息对等,双方都能确认自己和对方的收、发报文的能力,最后方便理解将信息对等制作成一个小表格:
防止超时
三次握手除了保证信息对等也是了防止请求超时导致脏连接。TTL网络报文的生存往往会超过TCP请求超时时间,如果两次握手就能创建连接,传输数据并释放连接后,第一个超时的连接请求才到达B机器,B机器 会以为是 A 创建新连接的请求,然后确认同意创建连接。因为A机器的状态不是SYN_SENT
,所以会直接丢弃了B的确认数据,导致 B 机器单方面的创建连接完毕。
如果是三次握手,则 B 机器收到连接请求后,同样会向 A 机器确同意创建连接,但因为 A 不是SYN_SENT
状态,所以 A机器 不会回复 B 机器确认创建连接请求,而 B 机器到一段时间后由于长时间没有收到确认信息,最终会导致连接创建失败,因此不会出现脏连接。
TCP断开连接
TCP是全双工通信,双方都能作为数据的发送方和接收方,但TCP会有断开的时候。TCP建立连接需要三次握手而断开连接却要四次,如图所示为TCP断开连接四次挥手过程:
A 机器发送关闭数据包将
FIN
设置为1,假设序列号为u
,发完关闭数据包后此时 A 机器处理FIN_WAIT_1
状态B 收到关闭连接请求后,通知应用程序处理完剩下的数据
B 响应 A 的关闭连接请求,将
ACK
标志设置为1,seq为v
,ack为u+1
,随后 B 机器处于CLOSE_WAIT
状态A 收到应答后,处于
FIN_WAIT_2
状态,继续等待 B 机器的FIN
数据包B 处理好现场后,主动向 A 机器发送数据包,并将
FIN
和ACK
标志设置为1,seq为w
,ack为u+1
,随后处于LAST_WAIT
状态等待 A 机器的应答A 机器收到
FIN
数据包后,随后发送ACK
数据包,seq为u+1
,ack为w+1
, 此时 A 机器处理TIME_WAIT
状态B 机器收到
ACK
响应包后,进行CLOSED
状态,连接正常关闭A 机器在
TIME_WAIT
状态等待2MSL
后,也进入CLOSEED
状态,连接关闭
什么是2MSL:MSL是Maximum Segment Lifetime英文的缩写,中文可以译为“报文最大生存时间”,
2MSL即两倍的MSL
四次挥手断开连接可以用更形象的方式来表达:
男生 :我们分手吧。
女生 :好的,我需要去家里把东西收拾完,再发消息给你。(此时男生不能再拥抱女生)
。。。,一个小时后
女生 :我收拾完了,分手吧(此时女生也不能再拥抱男生)
男生:好的(此时双方约定一段时间后,才可以分别找新的对象)
TCP四次挥手抓包验证
抓包过程与与三次握手抓包过程一致,这里不描述。直接看访问后抓包的截图:
第一个包是由
192.168.1.6
这台机器(也就是客户机),发送了一个FIN
包,seq为80
,ack为2782
第二个包由
183.232.231.174
(服务器),对192.168.1.6
这台机器(也就是客户机)发送了一个ACK
包,seq为2782
,ack为81
第三个包由
183.232.231.174
(服务器),对192.168.1.6
这台机器(也就是客户机)发送了一个ACK
和FIN
包,seq为2782
,ack为81
第四个包由
192.168.1.6
,向服务器响应了一个ACK
包,seq为81
,ack为2783
四次挥手流程与我们描述的一致。
TIME_WAIT 状态
主动要求关闭的机器(机器A)表示收到对方的FIN
报文后,并发送出ACK
报文后,进行TIME_WAIT
状态,等待2MSL
后进行CLOSED
状态。如果在TIME_WAIT_1
时收到FIN
标志和ACK
标志报文时,可以直接进入TIME_WAIT
状态,而无需进入TIME_WAIT_2
状态。
为什么要有 TIME_WAIT
确认被动关闭(机器B)能够顺利进入CLOSED
状态
假如A机器发送最后一个ACK
后,但由于网络原因ACK
包未能到达 B 机器,此时 B机器通常会认为 A机器 没有收到 FIN+ACK
报文,会重发一次FIN+ACK
报文。如果 A机器 发送最后一个ACK
后,自私的关闭连接进入 CLOSED
状态,就可能导致 B 无法收到ACK
报文,无法正常关闭。
防止失效请求
TIME_WAIT 状态可以防止已失效的请求包与正常连接的请求数据包混淆而发生异常。因为TIME_WAIT 状态无法真正释放句柄资源,在此期间, Socket中使用的本地端口在默认情况下不能再被使用。
CLOSE_WAIT 状态
被动关闭的机器(机器B)在收到对方发送的,FIN
报文后,马上回复ACK
报文,进入CLOSE_WAIT
状态。通知应用程序,处理剩下的数据,释放资源。