URL是什么?
统一资源定位符(或称统一资源定位器 /定位地址、URL 地址等,英语:Uniform / Universal Resource Locator,常缩写为 URL),有时也被俗称为网页地址(网址)。——摘自维基百科
URL即一种可以从互联网上定位到资源的表示,其中包含的服务器名称(域名)、协议(获取资源的方式、比如http,https,file等)、路径、文件名等内容。
比如:`http://jirengu.com/data/upload/2017/0118/17/587f39fba695a.png
http://
(协议类型) jscode.me/
(域名/服务器地址)data/upload/2017/0118/17/
(文件目录)587f39fba695a.png
(文件名)
当我们在浏览器上输入该URL时,浏览器会帮我们进行处理,向该域名进行请求。
域名与IP地址
互联网协议地址(英语:Internet Protocol Address,又译为网际协议地址),缩写为 IP 地址(英语:IP Address),是分配给网络上使用网络协议的设备的数字标签。常见的 IP 地址分为 IPv4 与 IPv6 两大类。——摘自维基百科
由于IP地址为一串数字标签,在使用中不便于记忆,因此域名会作为站点地址的表示。但IP地址才是服务器地址,所以域名需要进行IP地址的匹配,才能正确的找到对应服务器的文件,这就是域名解析。通过DNS等服务,我们会获得站点正确的IP地址,当然,如果遭到其中一环的劫持,我们也可能会跳转到恶意的服务器中。
-域名解析
域名解析通常会有以下几种方式:
- 浏览器缓存 – 通常,浏览器会缓存一段时间的 DNS
- 系统缓存 - 从本地的 Hosts 文件查找是否有该域名和对应 IP。
- 路由器缓存 – 一般路由器也会缓存域名信息。
- ISP DNS 缓存 – 通过运营商的 DNS 服务器(比如谷歌DNS、DNSpod、阿里DNS等DNS服务商)上查找缓存。
- 如果都没有找到,则向根域名服务器(.com .cn等)查找域名对应 IP,根域名服务器把请求转发到下一级,知道找到 IP
通过域名解析,我们的请求会发送到对应的IP地址下,当正常传递该请求后,对应IP地址下的服务器会接收我们的请求,并进行处理。
服务器
服务器是安装了操作系统的和Web Server的主机,服务器包含了硬件及软件部分,其中,Web Server是主要用于处理用户请求的软件。
- 常见的 web 服务器有 Apache、Nginx、IIS、Lighttpd
- web 服务器接收请求后,解析相应的请求,将该请求交给对应的网站代码(页面软件,比如django、flask、node.js等后端服务),或者接受请求反向代理到其他 web 服务器,进行下一轮请求。
当后端服务接受到请求时,则会进行网站的处理流程,根据用户请求的站点、路径、文件、方法等信息进行处理,返还对应的响应。
网站的处理
经过域名的解析,Web Server的处理,此时将交给网站软件处理。参考一个典型的MVC模型(model-view-controller):
处理流程:
- 用户的请求通过控制器交由模型进行处理
- 模型根据用户所需要的内容,在数据库中进行查询,并返还给控制器
- 控制器再将返还的数据填装至视图模板(页面模板)中,
- 控制器将填装好的页面信息返还给用户的浏览器
- 浏览器对页面信息进行解析,展示页面给用户
浏览器的处理
- HTML 字符串被浏览器接受后被一句句读取解析
- 解析到 link 标签后重新发送请求获取 css
- 解析到 script 标签后发送请求获取 js,并执行代码
- 解析到 img 标签后发送请求获取图片资源
- 浏览器根据 HTML 和 CSS 计算得到渲染树,绘制到屏幕上
- 执行 js 代码
由于HTML 字符中带有会进行请求的标签,因此当用户进行URL请求时,实际上是进行了多次的请求。
其他
除了基本的请求解析外,实际URL到对应域名服务器的过程中,还有硬件处理、信息的封装、各种协议的协调等等。