缓存是架构设计中一个重要的手段,它的技术比较简单,同时对性能提升又有特别显著的效果,在很多地方都会用到。使用缓存需要注意3个关键因素,它们决定了缓存的有效性、缓存的使用效率、缓存实现的效果:
1、缓存键集合大小
2、缓存空间的大小
3、缓存的使用寿命
阅读本篇文章将使用5分钟的时间,帮你提升缓存命中率。
0.什么是缓存的命中率?
缓存的主要特点是一次写入多次读出,通过这种手段减少对数据库的使用,尽快从缓存中读取数据,提高性能。所以缓存是否有效,主要就是看它一次写进去的缓存能不能够多次去读出来响应业务的请求,这个指标就叫做缓存的命中率。缓存命中率怎么算呢?查询得到正确缓存结果去比上总的查询次数,得到的指标就是缓存命中率,比如说十次查询九次都能够得到缓存的正确结果,他的命中率就是90%。
影响缓存命中率的主要因素有三个,分别是缓存键集合的大小、内存空间大小和缓存的寿命。
1.缓存键的集合大小。
缓存中的每个对象都是通过缓存键进行识别的。比如我们拿到key、value结构,key是字符串abc,value是字符串hello,abc就是其中的一个缓存键。键是缓存中唯一的识别符,定位一个对象的唯一方式就是对缓存键进行精确的匹配。
比如我们想缓存每个商品的在线商品信息,就需要使用商品ID作为缓存键。换句话说,缓存键空间是你的应用能够生成的所有键的数量。从统计数字上看,应用生成的唯一键越多,重用的机会越小。比如说根据IP地址缓存天气数据,可能需要40多亿个键。但是如果基于国家缓存天气数据,那么只需要几百个缓存键就够了,全世界也不过就几百个国家。
所以要尽可能减少缓存键的数量,键的数量越少,缓存的效率越高。设计缓存的时候要关注缓存键是如何进行设计的,它的整个的集合范围,限定在一个既能够高效使用,又可以减少它的数量,这个时候缓存的性能是最好的。
2.缓存可用空间的内存大小。
缓存可以使用的内存空间决定了缓存对象平均大小和缓存对象的数量。因为缓存通常是存储在内存中的,缓存对象可用的内存空间相对来说比较昂贵,而且受到严格限制。
如果想缓存更多的对象,就需要先删除老的对象,再添加新的对象。而这些老的对象被删除掉,就会影响到缓存的命中率。所以物理上缓存的空间越大,缓存的对象越多,缓存的命中率也就越高。
3.缓存对象的生存时间。
缓存对象的生存时间称为TTL。
对象缓存的时间越长,被重用的可能性就越高。使缓存失效的方法有两种:
1)超时失效
超时失效是在构建缓存,也就是在写缓存的时候,每个缓存对象都设置一个超时时间,在超时之前访问缓存就会返回缓存的数据,而一旦超时缓存就失效了,这时候再访问缓存,就会返回空。
2)实时清除
而实时清除是说,当有缓存对象更新的时候,直接通知缓存将已经被更新了的数据进行清除。清除了以后,应用程序下一次访问这个缓存对象键的时候,因为缓存已经清除了,不得不到数据库中去查找读取,这个时候就会得到最新的数据。因为更新总是更新在数据库里的。
还有一种虽然时间上还没有失效,但是新的对象要写入缓存,而内存空间不够了,这个时候就需要将一些老的缓存对象清理掉,为新的缓存对象腾出空间。
内存空间清除主要使用的算法是LRU算法,LRU算法就是最近最久未用算法。清除的时候,去清除那些最近最久没有被访问过的对象,这个算法使用链表结构实现的。所有的缓存对象都放在同一个链表上。当一个对象被访问的时候,就把这个对象移到整个链表的头部。当需要通过LRU算法清除那些最近最久未用对象的时候,只需要从队列的尾部进行查找,越是在队列尾部的越是最近最久没有被访问过的,优先清除的,腾出的内存空间让新对象加入进来。
以上3个条件即为决定缓存命中率的关键要素,熟练掌握后,会对缓存有更深的理解。
以上内容摘取自拉勾 《阿里前辈的架构经》 第02讲(上):分布式缓存 点击查看更多
主讲人:李智慧,前阿里巴巴技术专家,《大型网站技术架构》作者
加拉勾职场导师微信:lagouandy,可不定时参与简历1v1诊断抽奖活动,更有拉勾官方技术交流社群等你加入。