Cache 替换算法和写策略

前言:来吧,继续补 Cache 的知识。

替换算法

还记得组相联吗?就是主存中的一块可以放在 Cache 中的一组中的任意一行。但是 Cache 满了怎么办?就得覆盖掉一个,覆盖掉哪一个?这就是替换算法要解决的。

不去说什么先进先出、随机替换的算法。直接上最难的——最近最少用算法 LRU(least-recently used)

LRU

关键就是:总是把最近最少用的那一块淘汰掉

在具体到硬件的时候,Cache 每一行都有一个计数器。用来记录少用的次数。

具体看这个图:

现在有四个格子,但是有 5 个不一样的块要进来,我一步一步给你解释。

  • 1 来,没有命中,1 进入缓存。计数器为 0
  • 2 来,没有命中,2 进入缓存。2 计数器 0, 1计数器为 1(对应第三条)
  • 3 来同上
  • 4 来同上
  • 1 又来,命中,1 的计数器变为 0。其余加 1。
  • 2 又来,命中,2 的计数器变为 0。其余加 1。
  • 5 来了,但是现在 Cache 满了。去掉哪一个呢?计数器最大的那个!
  • 之后的就不说了

做题!

为了巩固上面的知识,我们来做题

MRU 的算法我们就不做了

假设主存以字为单位(16 位)先解决:「主存地址划分」

主存地址 = 主存标签 + 组号 + 块内地址

  • 所以块内地址就是 6 位。因为块的大小是 64 字,有 64 个单元
  • 由于是 4 路组相联。并且总大小是 4K 字。每一组的大小是 4 × 64 字。相除得到 4 。所以组号就是 4 位。
  • 标志位:由于告诉你主存空间大小是 32K × 16 位。所以剩下的就是标志位

所以得到

现在要循环访问 0~4351 10次

  • 当访问 0 时,未命中,把 0~63 所有内容搬到缓存中,后来全命中
  • 当访问 64 时,未命中,把 64~127 所有内容搬到缓存中,后来全命中
  • ......(把 4352 分为每块 64 个,一共 68 块的块 )
  • 当访问 64~67 块(从 0 开始数)时,都不在缓存中,要替换。

第一次循环结束

第二次循环开始的时候,一共会有 20 个块要替换。

每次循环都是这样

所以:

命中率为:(43520 - 68 - 9*20)/43520 = 99.43%

再放个图感受一下。。。(我是不是没讲清楚。。。)

写策略

为什么要保持 Cache 和主存中数据的一致?

  • 因为 Cache 中的内容是主存块副本,当对 Cache 中的内容进行更新时,就存在 Cache 和主存如何保持一致的问题。
  • 当多个设备都允许访问主存时

    例如: I/O 设备可直接读写内存时,如果 Cache 中的内容被修改,则 I/O 设备读出的对应主存单元的内容无效;若 I/O 设备修改了主存单元的内容,则 Cache 中对应的内容无效。

  • 当多个 CPU 都带有各自的 Cache 而共享主存时某个 CPU 修改了自身 Cache 中的内容,则对应的主存单元和其他 CPU 中对应的内容都变为无效。

写操作也有两种情况:

  • 写命中(Write Hit):要写的单元已经在 Cache 中
  • 写不命中(Write Miss):要写的单元不在 Cache 中

写策略

写命中:

  • Write Through(通过式写、写直达、直写)

    同时写 Cache 和主存单元。但是经常要和主存操作,速度太慢。可以使用写缓冲,并行操作。

  • Write Back(一次性写、写回、回写)

    只写 cache 不写主存,缺失(没找到)时一次写回。每行有个修改位(叫做 dirty 位),大大降低主存带宽需求,控制可能很复杂。

写不命中

  • Write Allocate(写分配)

    将主存装入 Cache 中,然后更新相应单元。这样可以利用空间局部特性,但是每次都要读一个块。速度慢

  • Not Write Allocate(非写分配)

    直接写主存单元,不把主存放入 Cache 中。

现代的计算机当然存在多级 Cache,我就不继续深挖了。。。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,607评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,239评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,960评论 0 355
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,750评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,764评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,604评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,347评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,253评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,702评论 1 315
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,893评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,015评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,734评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,352评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,934评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,052评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,216评论 3 371
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,969评论 2 355

推荐阅读更多精彩内容

  • 第一章 计算机组成与体系结构 1.1 计算机系统组成 1.1.1 计算机硬件的组成 控制器。控制器是分析和执行指令...
    步积阅读 1,966评论 0 15
  • CPU在一段较短的时间内,是对连续地址的一段很小的主存空间频繁地进行访问,而对此范围以外地址的访问甚少,这种现象称...
    lintong阅读 946评论 0 2
  • 为什么要有CPU Cache CPU的处理速度和内存的访问速度差距越来越大,甚至可以达到上万倍。 当处理器发出内存...
    专职跑龙套阅读 2,425评论 0 5
  • feisky云计算、虚拟化与Linux技术笔记posts - 1014, comments - 298, trac...
    不排版阅读 3,855评论 0 5
  • 一、概要 1、数据的表示:数制及其转换、原码、反码、补码、移码、浮点数、溢出、算...
    _Jason___阅读 3,136评论 0 5