缓存机制
基本参考: 彻底理解浏览器的缓存机制
- 浏览器第一次向服务器发起该请求后拿到请求结果,根据响应报文中HTTP头的缓存标识,决定是否缓存结果,是则将请求结果和缓存标识存入浏览器缓存中
- 之后浏览器每次发起请求,都会先在浏览器缓存中查找该请求的结果以及缓存标识,如果有的话,则直接使用浏览器缓存,没有的话,则会向服务端发送请求
- 浏览器每次拿到返回的请求结果,都会将该结果和缓存标识存入浏览器缓存中
浏览器是否需要向服务端重新发起HTTP请求,以此为依据,分为强制请求和协商请求
强制缓存
强制缓存就是向浏览器缓存查找该请求结果,并根据该结果的缓存规则来决定是否使用该缓存结果的过程
是否采用强制缓存,有以下几种情况
-
不存在该缓存结果和缓存标识,强制缓存失效,则直接向服务器发起请求(跟第一次发起请求一致),如下图:
-
存在该缓存结果和缓存标识,但该结果已失效,强制缓存失效,则使用协商缓存(见下文),如下图
-
存在该缓存结果和缓存标识,且该结果尚未失效,强制缓存生效,直接返回该结果,如下图
是否强制请求,取决于HTTP响应报文Expires和Cache-Control
Cache-Control优先级高于Expires
Expires
具体链接:Expires(MDN)
其值为服务器返回该请求结果缓存的到期时间,即再次发起该请求时,如果客户端的时间小于Expires的值时,直接使用缓存结果。
Cache-Control
- public:表明响应可以被任何对象(包括:发送请求的客户端,代理服务器,等等)缓存。
- private:表明响应只能被单个用户缓存,不能作为共享缓存(即代理服务器不能缓存它),可以缓存响应内容。
- no-cache:可以在本地缓存,可以在代理服务器缓存,但是这个缓存要服务器验证才可以使用。
- no-store:所有内容都不会被缓存,即不使用强制缓存,也不使用协商缓存
- max-age=xxx (xxx is numeric):缓存内容将在xxx秒后失效
内存缓存(from memory cache)和硬盘缓存(from disk cache)
强制缓存中的图片存放在内存缓存、硬盘缓存中
-
内存缓存(from memory cache):内存缓存具有两个特点,分别是快速读取和时效性:
- 快速读取:内存缓存会将编译解析后的文件,直接存入该进程的内存中,占据该进程一定的内存资源,以方便下次运行使用时的快速读取。
- 时效性:一旦该进程关闭,则该进程的内存则会清空。
- 硬盘缓存(from disk cache):硬盘缓存则是直接将缓存写入硬盘文件中,读取缓存需要对该缓存存放的硬盘文件进行I/O操作,然后重新解析该缓存内容,读取复杂,速度比内存缓存慢。
-
实例
在浏览器中,具体存内存呢,还是硬盘,好像每次都不一样;
以百度为例,打开界面后,按F5刷新,部分资源来源于memory,部分资源来源于disk,且来源于memory的资源加载快,都是0ms,从disk的加载速度也快于重新从服务端获取到的数据;
但关闭窗口后,重新再打开,则缓存资源都来源于disk(memory在窗口关闭都,就会被清空)
协商缓存
协商缓存就是强制缓存失效后,浏览器携带缓存标识向服务器发起请求,由服务器根据缓存标识决定是否使用缓存的过程,主要有以下两种情况:
-
协商缓存生效,返回304,如下
-
协商缓存失效,返回200和请求结果结果,如下
控制协商缓存的响应报文的HTTP头中的字段有:Last-Modified / If-Modified-Since和Etag / If-None-Match
Etag / If-None-Match的优先级比Last-Modified / If-Modified-Since高,同时存在,则只有Etag / If-None-Match生效
Last-Modified / If-Modified-Since
-
Last-Modified
是服务器响应请求时,返回该资源文件在服务器最后被修改的时间,如下。
-
If-Modified-Since
则是客户端再次发起该请求时,携带上次请求返回的Last-Modified值,通过此字段值告诉服务器该资源上次请求返回的最后被修改时间。
服务器收到该请求,发现请求头含有If-Modified-Since字段,则会根据If-Modified-Since的字段值与该资源在服务器的最后被修改时间做对比。
若服务器的资源最后被修改时间大于If-Modified-Since的字段值,则重新返回资源,状态码为200;否则则返回304,代表资源无更新,可继续使用缓存文件,如下。
Etag / If-None-Match
-
Etag
具体: Etag(MDN)
服务器响应请求时,返回当前资源文件的一个唯一标识(由服务器生成),如下。
当资源更新后,对应的etag值也会被更新。
-
If-None-Match
客户端再次发起该请求时,携带上次请求返回的唯一标识Etag值,通过此字段值告诉服务器该资源上次请求返回的唯一标识值。服务器收到该请求后,发现该请求头中含有If-None-Match,则会根据If-None-Match的字段值与该资源在服务器的Etag值做对比,一致则返回304,代表资源无更新,继续使用缓存文件;不一致则重新返回资源文件,状态码为200,如下
总结
强制缓存优先于协商缓存进行,若强制缓存(Expires和Cache-Control)生效则直接使用缓存,若不生效则进行协商缓存(Last-Modified / If-Modified-Since和Etag / If-None-Match),协商缓存由服务器决定是否使用缓存,若协商缓存失效,那么代表该请求的缓存失效,重新获取请求结果,再存入浏览器缓存中;生效则返回304,继续使用缓存,主要过程如下:
还有些比较好的文章
彻底理解浏览器的缓存机制
HTTP缓存机制(200还是304)
https://developer.mozilla.org/zh-CN/docs/Web/HTTP/Caching_FAQ
https://www.telerik.com/blogs/understanding-http-304-responses
https://blog.csdn.net/soonfly/article/details/50953814
浅聊HTTP缓存 (HTTP Cache)
https://developers.google.com/web/fundamentals/performance/optimizing-content-efficiency/http-caching?hl=zh-cn