Web服务器(诸如apache,IIS,Nginx)
简单的可以理解为一个可以接受HTTP请求报文,并且能够返回HTTP响应报文的应用软件,和你电脑上的QQ,微信其实是一样的,只不过当他们开始运行之后,可以监听某个端口,当有HTTP请求进来,可以自动的对该HTTP报文进行分析处理,最后自动以HTTP响应报文的格式返回给浏览器。
我们可以将Web服务工作流程抽象划分为三大步:
1. 接受到HTTP请求报文阶段
2. 解析并处理HTTP请求报文阶段(这一步是我们程序员的工作)
3. 返回HTTP响应报文阶段
下面贴上一段web服务代码,就这20行代码,就可以实现一个监听本机8080端口的HTTP请求,并可以做出响应的web服务器了。
不懂怎么执行的可以留言
string txtip = "127.0.0.1";
string txtport = "8080";
Socket socketWatch = new Socket(AddressFamily.InterNetwork, SocketType.Stream, ProtocolType.Tcp);
IPAddress ip = IPAddress.Parse(txtip);
IPEndPoint port = new IPEndPoint(ip, Convert.ToInt32(txtport));
socketWatch.Bind(port);
socketWatch.Listen(10);
while (true) {
Socket socketSend = socketWatch.Accept();
string strIp = socketSend.RemoteEndPoint.ToString();
byte[] buffer = new byte[2048];
int count = socketSend.Receive(buffer);
string str = Encoding.Default.GetString(buffer, 0, count);
string ss = "HTTP/1.0 200 OK\nContent-Type:text/html\n\n Welcome!Now Time:{0}";
string ss1 = "Web Server System";
DateTime dt = DateTime.Now;
string nn = string.Format(ss, dt.ToString());
int len = socketSend.Send(Encoding.ASCII.GetBytes(nn));
socketSend.Send(Encoding.ASCII.GetBytes(ss1));
socketSend.Close();
}
现在来分析以下上面代码到底做了什么。
第一步:确定好要监听的IP地址和端口号。
对比到apache,在httpd.conf配置文件里设置Listen:80,设置的就是监听的端口,而IP地址apache会默认读取该服务器的IP地址,正常情况下,服务器的IP地址都是公网地址。
第二步:绑定端口开始监听
从代码中可以看到,第一步是New了一个Socket类型的对象,重点难点都来了,这个Socket对象就是web服务器的核心对象了。
对socket的理解可以看我另外一篇博客Socket浅析 - 简书。
web服务器其实建立在socket的基础上的,socket具有接受HTTP请求,返回HTTP响应的能力。
上图的第二行代码是根据字符串生成一个IPAddress类型的对象,IPAddress对象代表了一个IP地址。
第三行代码根据IPAddress对象和一个整型的端口号可以new出一个IPEndPoint对象,IPEndPoint对象结合了IP地址和端口号,唯一标识了在互联网中的一个应用程序,这个也称为socket,套接字,插口。其本质是一样的,通过IP地址和端口号,可以在互联网上唯一标识某个应用程序,当某个客户端使用他的浏览器发出请求时,通过IPEndPoint对象,就可以找到互联网上的某个web服务器应用,如apache。
第四行代码是开始监听。
第三步:接受HTTP报文请求、解析HTTP报文
在第二步调用了listen函数之后,web服务器软件就已经监听本机的127.0.01:8080了,但是要接受到客户端发过来的报文,要先调用Accept,如图中第二行代码,该行代码的返回值类型是Socket类型,意思就是当有请求进行,Accept()会返回一个Socket对象,通过这个对象,程序可以获取到请求的所有信息(其实就是HTTP报文)。
如第三行,可以获取到请求的IP地址,如第五行,可以获取到HTTP报文,不过获取回来的数据是字节数组,转换一下即可获取到字符串类型的报文。
如上图,是我的代码运行截图,在str里我看到了HTTP报文字符串,我们知道,HTTP报文是有规则的,根据其规则,就可以将HTTP报文的各部分都解析出来(请求行,请求头,请求体),然后把这些信息交给后台程序(比如用PHP语言编写的PHP脚本,或者Java编写的jsp,C#编写的ASP),后台程序会根据请求的信息,去相应的地方收集和处理数据(如去数据库里查数据),当数据收集或者处理完毕之后。就进行下一步,构建HTTP响应报文,并返回。
第四步:构建并返回HTTP响应报文
如图中所示,ss和ss1,前者是构造了HTTP响应报文的头部信息(状态行、响应头等),后者构造了响应体,是一段HTML代码,如果在apache中,构造响应报文的工作应该是交给脚本程序完成的,当脚本程序构造好响应报文后,利用socket的send()方法,就可以将报文回送给刚刚的请求的客户端,需要主要的是,在这个过程中,socket对象必须是同一个对象,代表了一条TCP连接。
当这些步骤执行完毕之后,一次最基本的请求/响应流程就完成了。而一个最简单的web服务器也就实现了。
当然,这个是无敌简化版的web服务器,应用于生产环境中的web服务器肯定比这个复杂千万倍,但是本质是一样的,只不过生产环境中需要考虑操作系统的不同,并发量的不同,还要处理各种类型的数据等等,这些都是在本质的基础上不断叠加而生的。