那时,全地只有一种语言,都说一样的话。他们向东迁移的时候,在示拿地找到一片平原,就住在那里。他们彼此商量说:"来,让我们来做砖,把砖烧透了。"他们就拿砖当石头,又拿柏油当泥浆。他们说:"来,让我们建造一座城和一座塔,塔顶通天。我们要为自己立名,免得我们分散在全地面上。"耶和华降临,要看世人所建造的城和塔。耶和华说:"看哪,他们成了同一个民族,都有一样的语言。这只是他们开始做的事,现在他们想要做的任何事,就没有什么可拦阻他们了。来,我们下去,在那里变乱他们的语言,使他们彼此语言不通。"于是耶和华使他们从那里分散在全地面上;他们就停止建造那城了。因为耶和华在那里变乱了全地的语言,把人从那里分散在全地面上,所以那城名叫巴别塔。
-----------《圣经·旧约·创世记》
互联网的出现让人与人之间的关系变得前所未有的紧密,让科技的发展和文化的融合达到前所未有的高度,可以说,互联网就是现代的巴别塔。
最初的梦想
最初,每一台计算机都是一座信息孤岛,如何把他们联系起来呢?一群聪明人创造出了OSI模型,:将互联网这座巴别塔分为7层:
- 应用层(Application Layer)
- 表示层(Presentation Layer)
- 会话层(Session Layer)
- 传输层(Transport Layer)
- 网络层(Network Layer)
- 数据链路层(Data Link Layer)
- 物理层(Physical Layer)
妥协后的蓝图
上面的OSI模型很好的完成了层与层之间的解耦,每一层都遵循约定的规则(协议protocol)来完成互联网的部分环节,层与层之间通过接口通信。
然而,理想很丰满,现实很骨感。人们发现现有的技术很难实现OSI模型。最终,人们简化了这个模型:应用层、表示层、会话层合并为应用层;数据链路层、物理层合并为网络接口层。这就是TCP/IP模型:
层次 | 功能 | 协议 |
---|---|---|
应用层 | 传输最终形态的数据 | HTTP,HTTPS,FTP,SSH,POP3,SMTP |
传输层 | 传送文本数据 | TCP,UDP协议 |
网络层 | 分配地址和传送二进制数据 | IP协议 |
网络接口层 | 建立电路连接 | 以太网协议 |
具体的实现
1. 网络接口层
底层的数字信号都是由0和1组成的,我们需要根据某种通用的规则对这些电信号进行分组,这种通用规则就是以太网(Ethernet)协议。
以太网协议
以太网协议规定一组电信号构成一个数据包,叫做“帧”(Frame),每一帧由Head和Data两部分构成:
名称 | 首部 | 数据 | 尾部 |
---|---|---|---|
内容 | 发送者和接受者的网卡的Mac地址,数据类型 | 数据包实际内容 | 数据帧校验序列 |
以太网会以广播的形式将数据包发送给子网内所有主机。每台主机会比对头部的mac地址和自己的mac地址,如果一致就进行进一步处理,如果不一致就丢弃这个包。
2. 网络层
上面提到以太网会把数据包发给子网内所有主机,因此当接受者跟发送者不在同一个以太网中时怎么办呢?
以太网是一种局域网,而互联网是由无数的局域网组成的。可以说以太网是互联网的子集。
2.1 IP协议
IP协议制定了一套新地址,用来区分两台主机是否属于同一子网
2.2 ARP协议
如果在同一子网,直接根据IP地址获取Mac地址,然后由网络接口层进行后续操作即可。
2.3 路由协议
如果不在同一子网,,那我们就无法知道接收方的mac地址,以太网会将数据包发送到子网与子网之间的网关(Gateway)进行路由,最终将数据包发送到目标IP所在的子网中,然后通过ARP协议获取到接收方的mac地址。
一般来讲,这里的网关就是路由器,用来连接局域网和互联网。
3.传输层
通过网络层,目标主机接收到数据包。可是,实际上数据包是从一个主机的应用程序发送给另外一个主机的应用程序,我们怎么知道这个数据包是发给哪个应用程序的?
3.1 UDP协议
协议规定;每个应用程序联网时,都需要向操作系统申请一个端口,并且网络传输的数据包必须加入端口信息,即UDP数据包。这一点类似于网络接口层的“帧”。
可是,UDP写一下我们无法知道对方是否收到我们的数据包,所以TCP协议应运而生。
3.2 TCP协议
简单的说,TCP协议=UDP协议+确认机制。
确认机制由三次握手,四次分手组成。
3.2.1 三次握手
正式发送数据前,先建立TCP连接。
3.2.2 四次分手
数据发送完成后,断开TCP链接。
4.应用层
本层主要用来规范数据格式,以便于更好的被程序识别。常见有http,ftp等。因为经过前面三层的处理,应用层接收到的数据包就变成了这个样子:
以太网标头+IP标头+TCP标头+数据包
因为TCP协议,http协议过于复杂,此处不展开,过段时间详细总结一下。
END