TCP/IP网络分层模型
还是先从TCP/IP协议开始讲起,一是因为它非常经典,二是因为它是目前事实上的网络通信标准,研究它的 实用价值最大。
TCP/IP当初的设计者真的是非常聪明,创造性地提出了“分层”的概念,把复杂的网络通信划分出多个层 次,再给每一个层次分配不同的职责,层次内只专心做自己的事情就好,用“分而治之”的思想把一个“大 麻烦”拆分成了数个“小麻烦”,从而解决了网络通信的难题。
你应该对TCP/IP的协议栈有所了解吧,这里我再贴一下层次图。
CP/IP协议总共有四层,就像搭积木一样,每一层需要下层的支撑,同时又支撑着上层,任何一层被抽掉都 可能会导致整个协议栈坍塌。
第一层叫“链接层”(link layer),负责在以太网、WiFi这样的底层网络上发送原始数据包,工作在网卡这个层次,使用MAC地址来标记网络上的设备,所以有时候也叫MAC层。
第二层叫“网际层”或者“网络互连层”(internet layer),IP协议就处在这一层。因为IP协议定义了“IP 地址”的概念,所以就可以在“链接层”的基础上,用IP地址取代MAC地址,把许许多多的局域网、广域网 连接成一个虚拟的巨大网络,在这个网络里找设备时只要把IP地址再“翻译”成MAC地址就可以了。
第三层叫“传输层”(transport layer),这个层次协议的职责是保证数据在IP地址标记的两点之间“可 靠”地传输,是TCP协议工作的层次,另外还有它的一个“小伙伴”UDP。
TCP是一个有状态的协议,需要先与对方建立连接然后才能发送数据,而且保证数据不丢失不重复。而UDP 则比较简单,它无状态,不用事先建立连接就可以任意发送数据,但不保证数据一定会发到对方。两个协议 的另一个重要区别在于数据的形式。TCP的数据是连续的“字节流”,有先后顺序,而UDP则是分散的小数 据包,是顺序发,乱序收。
协议栈的第四层叫“应用层”(application layer),由于下面的三层把基础打得非常好,所以在这一层 就“百花齐放”了,有各种面向具体应用的协议。例如Telnet、SSH、FTP、SMTP等等,当然还有我们的 HTTP。
MAC层的传输单位是帧(frame),IP层的传输单位是包(packet),TCP层的传输单位是段 (segment),HTTP的传输单位则是消息或报文(message)。但这些名词并没有什么本质的区分,可以 统称为数据包。
OSI网络分层模型
TCP/IP发明于1970年代,当时除了它还有很多其他的网络协议,整个网络世界比较混乱。
这个时候国际标准组织(ISO)注意到了这种现象,感觉“野路子”太多,就想要来个“大一统”。于是设 计出了一个新的网络分层模型,想用这个新框架来统一既存的各种网络协议。
OSI模型分成了七层,部分层次与TCP/IP很像,从下到上分别是:
- 第一层:物理层,网络的物理形式,例如电缆、光纤、网卡、集线器等等;
- 第二层:数据链路层,它基本相当于TCP/IP的链接层;
- 第三层:网络层,相当于TCP/IP里的网际层;
- 第四层:传输层,相当于TCP/IP里的传输层;
- 第五层:会话层,维护网络中的连接状态,即保持会话和同步;
- 第六层:表示层,把数据转换为合适、可理解的语法和语义;
- 第七层:应用层,面向具体的应用传输数据。
TCP/IP等协议已经在许多网络上实际运行,再推翻重来是不可能的。所 以,OSI分层模型在发布的时候就明确地表明是一个“参考”,不是强制标准.
但OSI模型也是有优点的。对比一下就可以看出,TCP/IP是一个纯软件的栈,没有网络应有的最根基的电 缆、网卡等物理设备的位置。而OSI则补足了这个缺失,在理论层面上描述网络更加完整。
还有一个重要的形式上的优点:OSI为每一层标记了明确了编号,最底层是一层,最上层是七层,而TCP/IP 的层次从来只有名字而没有编号。显然,在交流的时候说“七层”要比“应用层”更简单快捷,特别是英 文,对比一下“Layer seven”与“application layer”。
综合以上几点,在OSI模型之后,“四层”“七层”这样的说法就逐渐流行开了。不过在实际工作中你一定 要注意,这种说法只是“理论上”的层次,并不是与现实完全对应。
两个分层模型的映射关系
好在OSI在设计之初就参考了TCP/IP等多个协议,可以比较容易但不是很精确地实现对应关系。
- 第一层:物理层,TCP/IP里无对应;
- 第二层:数据链路层,对应TCP/IP的链接层;
- 第三层:网络层,对应TCP/IP的网际层;
- 第四层:传输层,对应TCP/IP的传输层;
- 第五、六、七层:统一对应到TCP/IP的应用层。
OSI的分层模型在四层以上分的太细,而TCP/IP实际应用时的会话管理、编码转换、压缩等和具体应用经常 联系的很紧密,很难分开。例如,HTTP协议就同时包含了连接管理和数据格式定义。
到这里,你应该能够明白一开始那些“某某层”的概念了。
所谓的“四层负载均衡”就是指工作在传输层上,基于TCP/IP协议的特性,例如IP地址、端口号等实现对后 端服务器的负载均衡。
所谓的“七层负载均衡”就是指工作在应用层上,看到的是HTTP协议,解析HTTP报文里的URI、主机名、 资源类型等数据,再用适当的策略转发给后端服务器。
TCP/IP协议栈的工作方式
HTTP协议的传输过程就是这样通过协议栈逐层向下,每一层都添加本层的专有数据,层层打包,然后通过 下层发送出去。
接收数据是则是相反的操作,从下往上穿过协议栈,逐层拆包,每层去掉本层的专有头,上层就会拿到自己 的数据。
但下层的传输过程对于上层是完全“透明”的,上层也不需要关心下层的具体实现细节,所以就HTTP层次 来看,它不管下层是不是TCP/IP协议,看到的只是一个可靠的传输链路,只要把数据加上自己的头,对方就能原样收到。