对于TCP,Http,Socket这些名词,你是否熟悉呢,他们有哪些异同点呢?带着这些疑问,开始我们的学习之旅
故事还要从七层网络协议开始...
七层网络协议
- 物理层 建立、维护、断开物理连接。(由底层网络定义协议)
- 数据链路层 建立逻辑连接、进行硬件地址寻址、差错校验等功能。(由底层网络定义协议)
-
网络层 进行逻辑地址寻址,实现不同网络之间的路径选择。
常见协议有:ICMP IGMP IP(IPV4 IPV6) ARP RARP -
传输层 定义传输数据的协议端口号,以及流控和差错校验。
常见协议有:TCP UDP,数据包一旦离开网卡即进入网络传输层 -
会话层 建立、管理、终止会话。(在五层模型里面已经合并到了应用层)
对应主机进程,指本地主机与远程主机正在进行的会话。 -
表示层 数据的表示、安全、压缩。(在五层模型里面已经合并到了应用层)
常见格式有,JPEG、ASCll、DECOIC、加密格式等 -
应用层 网络服务与最终用户的一个接口。
常见协议有:HTTP FTP TFTP SMTP SNMP DNS TELNET HTTPS POP3 DHCP
IP TCP UDP HTTP
通过对七层网络协议的了解,IP协议对应网络层,TCP协议对应于传输层,而http协议对应于应用层,从本质上来说,三者是不同层面的东西,如果打个比方的话,IP就像高速公路,TCP就如同卡车,http就如同货物,货物要装载在卡车并通过高速公路才能从一个地点送到另一个地点。
那TCP与UDP的区别又是什么呢?
TCP 传输控制协议,Transmission Control Protocol
TCP是一种面向连接的、可靠的、基于字节流的传输层通信协议。UDP 用户数据报协议,User Datagram Protocol
UDP是OSI(Open System Interconnection,开放式系统互联) 参考模型中一种无连接的传输层协议,提供面向事务的简单不可靠信息传送服务。
TCP是面向连接的传输控制协议,提供可靠的数据服务(类似于打电话)
UDP是提供无连接的数据报服务,传输不可靠,可能丢包(类似于发短信)
TCP首部开销20字节,UDP首部开销8字节
TCP只能是点到点的连接,UDP支持一对一,一对多,多对一,多对多的交互通信
TCP逻辑通信信道是全双工的可靠信道,UDP则是不可靠信道
注:什么是单工、半双工、全工通信?
信息只能单向传送为单工;
信息能双向传送但不能同时双向传送称为半双工;
信息能够同时双向传送则称为全双工。
TCP的三次握手
TCP建立一个连接需要3次握手IP数据包,断开连接需要4次握手。TCP因为建立连接、释放连接、IP分组校验排序等需要额外工作,速度较UDP慢许多。TCP适合传输数据,UDP适合流媒体
第一次握手:客户端发送syn包(syn=j)到服务器,并进入SYN_SEND状态,等待服务器确认;
第二次握手:服务器收到syn包,必须确认客户的SYN(ack=j+1),同时自己也发送一个SYN包(syn=k),即SYN+ACK包,此时服务器进入SYN_RECV状态;
第三次握手:客户端收到服务器的SYN+ACK包,向服务器发送确认包ACK(ack=k+1),此包发送完毕,客户端和服务器进入ESTABLISHED状态,完成三次握手。
Socket
我们知道两个进程如果需要进行通讯最基本的一个前提能能够唯一的标示一个进程,在本地进程通讯中我们可以使用PID来唯一标示一个进程,但PID只在本地唯一,网络中的两个进程PID冲突几率很大,这时候我们需要另辟它径了,我们知道IP层的ip地址可以唯一标示主机,而TCP层协议和端口号可以唯一标示主机的一个进程,这样我们可以利用ip地址+协议+端口号唯一标示网络中的一个进程。
能够唯一标示网络中的进程后,它们就可以利用socket进行通信了,什么是socket呢?我们经常把socket翻译为套接字,socket是在应用层和传输层之间的一个抽象层,它把TCP/IP层复杂的操作抽象为几个简单的接口供应用层调用已实现进程在网络中通信。
socket起源于UNIX,在Unix一切皆文件哲学的思想下,socket是一种"打开—读/写—关闭"模式的实现,服务器和客户端各自维护一个"文件",在建立连接打开后,可以向自己文件写入内容供对方读取或者读取对方内容,通讯结束时关闭文件。
Socket通信流程
socket是"打开—读/写—关闭"模式的实现,以使用TCP协议通讯的socket为例,其交互流程大概是下图这样的:
WebSocket
WebSocket protocol 是HTML5一种新的协议。它实现了浏览器与服务器全双工通信,能更好的节省服务器资源和带宽并达到实时通讯它建立在TCP之上,同 HTTP一样通过TCP来传输数据。WebSocket同HTTP一样也是应用层的协议,并且一开始的握手也需要借助HTTP请求完成。
它和 HTTP 最大不同是:
- WebSocket 是一种双向通信协议,在建立连接后,WebSocket 服务器和 Browser/Client Agent 都能主动的向对方发送或接收数据,就像 Socket 一样;
- WebSocket 需要类似 TCP 的客户端和服务器端通过握手连接,连接成功后才能相互通信。
HTTP请求客户端服务器交互图
WebSocket客户端服务器交互图
上图对比可以看出,相对于传统 HTTP 每次请求-应答都需要客户端与服务端建立连接的模式,WebSocket 是类似 Socket 的 TCP 长连接的通讯模式,一旦 WebSocket 连接建立后,后续数据都以帧序列的形式传输。在客户端断开 WebSocket 连接或 Server 端断掉连接前,不需要客户端和服务端重新发起连接请求。在海量并发及客户端与服务器交互负载流量大的情况下,极大的节省了网络带宽资源的消耗,有明显的性能优势,且客户端发送和接受消息是在同一个持久连接上发起,实时性优势明显。
WebSocket连接过程(握手)
从WebSocket客户端服务器交互图可以看出,在WebSocket中,只需要服务器和浏览器通过HTTP协议进行一个握手的动作,然后单独建立一条TCP的通信通道进行数据的传送。
- 浏览器,服务器建立TCP连接,三次握手。这是通信的基础,传输控制层,若失败后续都不执行。
- TCP连接成功后,浏览器通过HTTP协议向服务器传送WebSocket支持的版本号等信息。(开始前的HTTP握手)
- 服务器收到客户端的握手请求后,同样采用HTTP协议回馈数据。
- 当收到了连接成功的消息后,通过TCP通道进行传输通信。
RPC
Remote Procedure Call 远程过程调用
它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在,如TCP或UDP,为通信程序之间携带信息数据。在OSI网络通信模型中,RPC跨越了传输层和应用层。RPC使得开发包括网络分布式多程序在内的应用程序更加容易。
先说说RPC服务的基本架构吧。一个完整的RPC架构里面包含了四个核心的组件,分别是Client ,Server,Client Stub以及Server Stub,这个Stub大家可以理解为存根。
- 客户端(Client),服务的调用方。
- 服务端(Server),真正的服务提供者。
- 客户端存根,存放服务端的地址消息,再将客户端的请求参数打包成网络消息,然后通过网络远程发送给服务方。
- 服务端存根,接收客户端发送过来的消息,将消息解包,并调用本地的方法。
RPC采用客户机/服务器模式,通信是建立在Socket之上的,出于一种类比的愿望,在一台机器上运行的主程序,可以调用另一台机器上准备好的子程序,就像LPC(本地过程调用)。请求程序就是一个客户机,而服务提供程序就是一个服务器。首先,调用进程发送一个有进程参数的调用信息到服务进程,然后等待应答信息。在服务器端,进程保持睡眠状态直到调用信息的到达为止。当一个调用信息到达,服务器获得进程参数,计算结果,发送答复信息,然后等待下一个调用信息,最后,客户端调用过程接收答复信息,获得进程结果,然后调用执行继续进行。
RPC vs HTTP
- 论复杂度,RPC框架肯定是高于简单的HTTP接口的。但毋庸置疑,HTTP接口由于受限于HTTP协议,需要带HTTP请求头,还有三次握手,导致传输起来效率或者说安全性不如RPC。
- HTTP是一种协议,RPC可以通过HTTP来实现,也可以通过Socket自己实现一套协议来实现.
- RPC更是一个软件结构概念,是构建分布式应用的理论基础。就好比为啥你家可以用到发电厂发出来的电?是因为电是可以传输的。至于用铜线还是用铁丝还是其他 种类的导线,也就是用http还是用其他协议的问题了。
Rest & Restful
Rest全称是Representational State Transfer,中文意思是表述性状态转移。Rest指的是一组架构约束条件和原则。如果一个架构符合Rest的约束条件和原则,我们就称它为Restful架构。
然而Rest本身并没有创造新的技术、组件或服务,而隐藏在Restful背后的理念就是使用Web的现有特征和能力, 更好地使用现有Web标准中的一些准则和约束。我们现在所说的Rest是基于HTTP协议之上来讲的,但Rest架构风格并不是绑定在HTTP上,只不过目前HTTP是唯一与Rest相关的实例。
Rest架构的主要原则
- 在Rest中的一切都被认为是一种资源。
- 每个资源由URI标识。
- 使用统一的接口。处理资源使用POST,GET,PUT,DELETE操作类似创建,读取,更新和删除(CRUD)操作。
- 无状态:每个请求是一个独立的请求。从客户端到服务器的每个请求* * 都必须包含所有必要的信息,以便于理解。
- 同一个资源具有多种表现形式,例如XML,JSON
Restful API 简单例子
[POST] http://localhost/users // 新增
[GET] http://localhost/users/1 // 查询
[PATCH] http://localhost/users/1 // 更新
[PUT] http://localhost/users/1 // 覆盖,全部更新
[DELETE] http://localhost/users/1 // 删除