用户打开浏览器,输入baidu.com,页面展示百度首页。整个过程发生了什么?
这是一个从URL输入到页面展现的过程。
名词解释:
- URL:统一资源定位符(Uniform Resource Locator,URL),用于定位互联网上的资源并指出访问方法。互联网上的每个文件都有一个唯一的URL,指出文件的位置以及浏览器应该怎么处理它。
- DNS:域名系统(Domain Name System),因特网上作为域名和IP地址相互映射的一个分布式数据库,能够使用户更方便的访问互联网,而不用去记住能够被机器直接读取的IP数串。通过主机名,最终得到该主机名对应的IP地址的过程叫做域名解析(或主机名解析)。每个IP地址都可以有一个主机名,主机名由一个或多个字符串组成,字符串之间用小数点隔开。有了主机名,就不要死记硬背每台IP设备的IP地址,只要记住相对直观有意义的主机名就行了。这就是DNS协议所要完成的功能。
- ISP:互联网服务提供商(Internet Service Provider),即向广大用户综合提供互联网接入业务、信息业务、和增值业务的电信运营商。
- dom:文档对象模型(Document Object Model,简称DOM),是W3C组织推荐的处理可扩展标志语言的标准编程接口。在网页上,组织页面(或文档)的对象被组织在一个树形结构中,用来表示文档中对象的标准模型就称为DOM。
1.在浏览器里输入URL
用户打开浏览器,输入baidu.com。
2.域名解析
域名解析就是域名到IP地址的转换过程。域名的解析工作由DNS服务器完成。即查找域名(baidu.com)网站所在服务器的IP地址,域名解析的流程如下:
- 从浏览器缓存里找:浏览器会缓存之前用过的DNS一段时间(若无转至下一步)。
- 从系统缓存里找:从Host文件查找是否有该域名对应的IP(若无转至下一步)。
- 从路由器缓存里找:从路由器中查找该域名IP地址的缓存信息(若无转至下一步)。
- 从ISP DNS缓存里找:从ISP(例如:电信)的DNS上查找该域名IP地址的缓存信息(若无转至下一步)。
- 如以上方法都没找到,则向根域名服务器查找域名对应的IP,直到找到为止。
3.服务器处理
服务器是一台安装系统的机器。系统里安装的处理请求的应用叫Web server,用于接受用户的请求,返回给网站代码。常见的web服务器有Apache、Nginx、IIS、Lighttpd。
浏览器把用户发起的HTTP请求发送给服务器后,Web server会在它自己的存储空间中搜索所请求的文件(因为同一个服务器地址,可能同时绑定了多个域名,此时需要配置web服务器将请求转给相应的端口)。当找到文件时,服务器会读取它,按需处理它,并且把它传送回浏览器。Web server就相当于起到了内容分发的作用。
4.网站处理
网站处理,就是实际后台处理的工作。后台开发有很多框架,但大部分是按照MVC设计模式进行搭建的。MVC是一个设计模式,将应用程序分成三个核心部件:模型(model)、视图(view)、控制器(controller)。
控制器统一管理,接收服务器传送过来的用户请求并调用模型和视图去完成用户需求(决定调用哪个模型构件去处理请求,然后确定用哪个视图来显示模型处理返回的数据)。如需查找所需用户的数据,便向模型要数据,模型操作数据库,查找所需数据,找到后发回给控制器。视图是HTML模板,把数据填入模板生成HTML,发回给控制器。控制器从模型中拿到数据,然后从视图中拿到HTML,经过处理,返回html字符串给浏览器。
5.浏览器处理
通过后台处理返回的html字符串结果会被浏览器读取解析,对应的就是html页面加载、解析、渲染的工作。
(1)加载
浏览器对一个html页面的加载顺序是从上而下的,并在加载过程中进行解析渲染处理。在这个过程中遇到link标签、image标签、script标签时,浏览器会再次向服务器发送请求获取css文件、图片资源、js文件,并执行js代码,同步进行加载解析。
(2)解析、渲染
解析的过程,就是生成解析树,即dom树。dom树是由dom元素及属性节点组成,加上css解析的样式对象和js解析后的动作实现。而渲染,就是将dom树进行可视化表示。
6.绘制网页
浏览器通过上面步骤计算得到渲染树(dom树的可视化表示),构建渲染树使页面以正确的顺序绘制出来,遵循一定的规则经过一系列渲染工作后,实现网页的绘制,至此最终完成了百度首页的展示。