前言:继续底层一点的知识。
一切都要从为什么要分页开始
为什么要分页
啥是页?记得我们在程序的链接中画的那个图吗?
由于程序的局部特性,在运行的时候,没有把所有程序代码(可执行文件)一次性直接加载到主存中。每次只用执行代码的一部分(这就是分页)。这样就可以节省主存资源,在主存中放入更多的程序
一些基本概念
在上一节中,我们搞清楚了:页就是可执行文件的一部分。
这一节中我们得弄清楚一些基本概念:
-
「逻辑地址、虚拟地址」
逻辑地址和虚拟地址是一样的东西。程序中指令所用地址。
-
「物理地址」
存放指令或者数据的实际内存地址
-
虚拟地址与物理地址之间的关系
有一个叫做「页表」的东西完成了虚拟地址与物理地址之间的转换
详细介绍「页表」
简单来说,页表用来做虚拟地址到物理地址的映射。页表存储在主存中,而有一个保存页表地址的「页表基址寄存器」。
其实用一张图就能表示虚拟存储技术的实质。
页表结构
既然是表,那么就有表项,每个表项都会记录对应代码、数据块的信息。
图中:
装入位:表示信息是否有效。
修改位:记录当前代码块、数据块是否被修改。采用 write back 的技术更新磁盘,否则太慢
替换控制位:当页表满了,需要填入新的页的时候,要根据「替换控制位」选择替换哪个页,与前面说的 Cache 的 LRU 算法类似。
其他:我们说,每个页就是代码块,在可执行文件中,每个代码段是有权限的,可读可写还是只可读、可执行
实页号:实页就是实际物理地址,它的大小和虚拟地址空间的页相同。所以只要找到虚拟地址的页号对应的实页号就能找到程序
在开始详细的例子之前,我们还得理解一个结构(TLB)
详解 TLB(Translation Look-Aside Buffers)
在之前说 Cache 的时候,我们说,假设 CPU 给的是主存的物理地址。但是在我们学习的时候我们知道,主存给的是虚拟地址。
虚拟地址怎么得到物理地址?去页表中找。
但是我们知道页表存在主存中,访问主存又太慢了,所以在 Cache 中有这样一张 TLB 的表。帮助快速找到物理地址。
把经常要查的页表项放到 Cache 中,这种在 Cache 中的页表项组成的页表称为 Translation Lookaside Buffer 或者 TLB(快表)
又说到表了,逃不开的表项:
这里有两点要注意的:
- TLB 表是全相联,目的就是提高命中率,这样速度更快
- VA 只保存了 tag。原因是,我们只需要知道那一页在不在就好了。虚拟地址是啥:虚拟地址是指令所在的地址。这是包含的指令,我们只需要知道,指令所需的代码页在不在就好了。所以只需要 tag 标签。
好了现在可以完全理解 CPU 访问存储的过程了
CPU 访存的过程
- CPU 给出虚拟地址 VA。
- TLB 根据 VA 的 tag 查表,如果命中,转换成物理地址给 Cache。如果不命中去,页表(主存)里面查询,如果命中,转换成物理地址给 Cache。如果不命中,页缺失。
- Cache 根据物理地址返回给 CPU 数据。
用一张图表示就是这样:
举个具体栗子
虚拟地址
=虚拟页
+块内地址
物理地址
=物理页
+块内地址
由于页大小是 64B。按字节编址,就有 64 个块内地址。所以块内地址
6 位。虚拟页
8 位。物理页
6 位
第一问结束,第二问
首先,解释什么是 TLBT 和 TLBI
-
TLBI
TLBI 其实就是 TLB Index。之前我们说 TLB 表项有一项是 VA Tag,对吧。所以 TLBI 其实是 VA Tag 的一部分。用来告诉你在块群里面的相对位置。也就是说,块群的大小与组的大小相等。因此,TLBI 就是 2 位
-
TLBT
TLB Tag 就是 6 位。TLBT 就是告诉你你属于哪个块群
第二问结束,第三问
主存地址
= 块群地址
+ 块群内块地址
+ 块内地址
所以块内地址
= 2 位
由于是直接映射:也就是块群大小是 16。所以块群内块地址的
= 4 位。最后相减得到块群地址
= 6 位
第三问结束,最后一问
- 第一步,划分地址
TLBT = 0x3 哪一个块群
TLBI = 0x3 块群的那一块
TLBT 要对 TLB 表中的组数取余,决定放哪个组。这里对 4 取余。得到 3。
所以是第三组的第三个数据,代表着我要的数据,查表得到
Y,最后返回 0X0D。
得到 PPN 是 0D。以后,拓展成 12 位:
001101 0101 00
已知前面 6 位是 Catch Tag
后四位 0101 是 Catch Index
.也就是说这个数据在 Idx 5 处
对比 Tag 相同。
由于是小端方式。 00 是低位地址,也就是 36。要取 16 位的数据。
所以最后得到:0x7236
......好难....终于写完