本文试图用有限的篇幅来阐述80386保护模式重要知识点。本文不是一个系统全面的知识介绍,您可能需要了解相关的80386汇编,微型计算机原理和C语言知识。
适合读者:需要了解8386 CPU工作模式,适合正在学习微机原理的同学和准备阅读Linux内核代码的码农。想自己做一个操作系统的同学也可以从本文中获得一些知识储备。
关于80386寻址
什么是寻址
这里说的寻址(addressing)是指CPU内部如何计算物理内存地址(位置)的过程。CPU要处理的数据和代码总是在内存中存取的(暂不讨论CPU缓存),了解一个CPU是如何定位和计算内存地址是理解CPU工作原理的基础。80386采用分段分页来管理内存,之所以没有被设计成固定内存位置寻址(内存位置固定标记,CPU按固定地址存取)有很多原因:
为什么要分段
- 对8086来说:CPU是16位的,CPU只能处理16位的地址,而其地址总线却有20位。只有通过分段才能访问所有地址。(SS * 16 + SP最大可以表示20位地址, SS:段地址,SP:偏移地址)。之所以要设计20位地址总线,是因为8086的设计目标是支持最大1M内存。
- 分段机制不让程序直接访问物理内存地址,可以让程序使用的内存地址虚拟化。这种机制可以让操作系统更加灵活和方便管物理内存地址,增加物理内存地址利用率。
- 对80X86来说:保护模式中的分段分页使得内存使用和分配更加灵活。本篇中下面章节会有详细论述。
8086寻址方式
8086中,程序使用的地址(逻辑地址),是由16位的段地址和16位的段内偏移组成。段地址保存在用户程序中,程序加载时被加载在段寄存器内。之后程序中指令直接使用段内偏移地址(也叫段内偏移量)即可。CPU在寻址(如何计算得到物理内存地址)时会经过如下步骤:
- 取得该程序加载在段寄存器中的段地址;
- 取得当前指令使用的偏移地址;
- 将#1和#2中的地址使带入公式A计算得出得到物理内存地址。
其中公式A可归纳成SS * 16 + SP。
80386寻址方式
80386与8086只是公式A 有所不同的。80386的逻辑地址同样也由两部分组成:16位段选择子和32位段内偏移。寻址步骤如下:
- 取得该程序的段选择子,同样也是加载在段寄存器中;
- 取得当前指令使用的偏移地址;
- 将#1和#2中的地址带入公式A计算得出得到物理内存地址(如果没有分页)
注意:段选择子其实同样被加载在16位段寄存器中,只是80386中我们用了个不同的名字,后面章节会解释为什么取这个名字。
从上面2点可以看出从8086到80386CPU寻址方式总体没有差别。它们都是通过段寄存器和偏移地址来寻址,寻址方式都可表示成:
物理地址 = 段寄存器[段内偏移]
从8086到80386所不同的是,上面的步骤3中的公式A和偏移地址长度发生了变化。
8086步骤#3中的地址公式A如下:
20位的物理地址 = 段地址(16位) * 16 + 段内偏移(16位)
一般教科书都有类似这样的表述:段地址左移四位+偏移地址形成20位物理地址。左移4位相当于乘以16(2的4次方),这里16也经常被写成16进制形式10h。
而80386步骤#3中的地址公式A是这样的:
- 根据段选择子内容找到段基地址(32位)
- 用下面公式计算得到32位物理地址:
32位物理地址 = 段基地址(32位) + 段内偏移(32位)
之所以在80386中,段地址叫选择子是因为段基地址是由段寄存器中的内容选择指定的。
需要指出的是80386还多了一个分页的功能,这个功能是可选的。如果启用分页功能(本文最后会对分页详细描述),通过上面步骤计算得到地址叫做线性地址,CPU要进一步处理才能得到最终的物理地址。
重要寄存器和数据结构
本节内容需要花一定的时间去记忆和理解,难点在于只有同时理解并记住这些概念才能融汇贯通。这只有反复阅读和思考才能做到。建议阅读中遇到难以理解的问题可以先了解个大概后跳过,等到需要理解具体相关内容时,再返回来仔细阅读和理解。
描述符(Descriptor)
具有固定长度的结构体(struct),共8个字节。这个结构体保存着一个段基地址的所有信息,包含:
- 段基地址
- 段长度
- 段属性
描述符有两种,这两种结构体包含的内容几乎都一样,只有一些细小的差别,这两种描述符分别是:
- 非系统描述符:用来描述数据段,代码段和堆栈段的结构;
- 系统段描述符:用来描述LDT和TSS的,(LDT和TSS在后面有说明)。
全局描述符表(GDT: Global Descripter Table)
顾名思义,它是一个表结构。这个表存储在内存中,相当于C语言中的一个结构体数组。数组的每一项就是上面所说的描述符。GDT在一个多任务系统中一般只设置一个,其基址由一个GDTR确定(GDT靠GDTR定位),GDT地址在设置好之后几乎不会被改变。这个表中可以包含如下四种信息的描述符:
- 全局数据段,代码段和堆栈段信息。这些段一般由操作系统内核使用。
- 对LDT的描述,这个描述符的基址就是是LDT所在内存中的起始地址
- 对TSS的描述,这个描述符的基址是TSS所在内存中的起始地址
- 一些门描述符(调用门,中断门等…)。
其中#1属于非系统段描述符,#2 #3 #4属于系统段描述符。描述符各自的属性值决定了它们具体是哪类描述符。其中,LDT,TSS属于具体每个任务,一般成对出现在GDT中。
全局描述符表寄存器(GDTR:Global Descripter Table Register)
GDTR是一个CPU寄存器,和AX BX.. CS DS...一个概念。GDTR共48位,包含两部分内容:
- 开头32位用来保存一个内存地址,指出GDT在内存中的位置(如果没有开启分页,它就是一个32位的物理地址);
- 随后16位为GDT的长度信息,即GDT共有有多少项。
局部描述符表(LDT:Local Descripter Table)
与GDT的结构类似,所不同的是,LDT用来描述每个具体用户任务代码段,堆栈段和数据段信息。LTD是针对每个用户任务的,类似TSS这样的全局信息相关的描述项自然只存在GDT中,LDT中不会有。LDT描述项一般和正在运行的用户任务数相等。每个用户任务都可能有自己的LDT,保存着本任务相关信息。LDT的基址作为一条记录保存在GDT中(参见上面GDT#2)。
局部描述符表寄存器(LDTR:Global Descripter Table Register)
LDTR也是一个寄存器,和GDTR类似,不同的是它只有16位。LDTR中存放的是一个16位选择子,寻址时用选择子内容去GDT中定位寻找LDT的基址。LDTR当作为选择子,任务切换时只要改变其中存放的选择子内容就能实现LDT的切换。
任务寄存器(TR:Task Register)
也是一个16为的选择子,作用和LDTR类似,都是用来索引全局描述符表(GDT)中的一项。所不同的是TR选择和指向的是一个任务状态段地址(TSS:Task Status Segment)。
任务状态段(TSS:Task State Segment)
正如前文所说,任务状态段(TSS)信息是在GDT中描述的。任务状态段也是是内存中的一个数据结构。这个结构中保存着和任务相关的信息。当运行着的任务准备切换时,CPU会把当前任务用到的寄存器内容(CS EIP DS SS...)包括LDT的选择子等信息保存在TSS中以便任务切换回来时候继续使用。
选择子(Selector)
前文相关内容已经多次提及选择子,选择子按照用途共有三种,其格式完全一样,仅仅用途不同。
- TR中的选择子,指向GDT中一个TSS的描述项。
- LDTR中的选择子,指向GDT中一个LDT的描述项。
- 用户程序中的逻辑地址组成部分(这个地址即虚拟地址48位=16位选择子+32位偏移地址)。它用来选择程序用到的数据段,代码段等在LDT中的描述项。此处的选择子由编译,连接或者操作系统决定的。
80386中除了上述寄存器以外,还有一些用户程序不可访问的高速缓冲寄存器寄存器,为的是提高CPU计算性能。为了简化问题我们暂时可以忽略它的存在。
分页机制
控制寄存器(Control Registor)CR3中保存着一个页基址A,如果分页被启用,线性地址经需要经过两级页变换成最终的物理地址:具体过程见下图.
参见上图,线性地址从高到底被分成三个部分高10位B,中间10位C,末12位D。变换过程不再描述,语言描述可能看上去复杂,图表相对清晰,这里结合上图给出一个变换过程公式,结合上图应该可以比较清楚的看出分页机制。
页基址 = A;
页基址 = 页基址 + B * 4; /* 查一级目录页表,在(页基址+B*4)处取得二级页表的的基址,这里等号代表查表 */
页基址 = 页基址 + C * 4; /* 查二级目录页表,在(页基址+B*4)处取得物理基址,这里等号代表查表 */
物理地址 = 物理基址 + D;
上述公式中B和C为什么要乘以4?因为页表按4位对齐的。页目录项后四位不用。
类似的,GDT/LDT中一项长度为8字节,选择子去GDT/LDT中索引如下:
描述符地址 = Base + Selector * 8.
80386内存管理和任务切换过程
一个80386操作系系统中运行两个用户任务A和B,如图:
任务A运行时CPU和内存状态如下
切换到任务B运行时,CPU和内存状态如下
为了简化问题,上图没有画出隐藏寄存器的使用情况。实际上,TR,LDTR之后都有一个64位(内容和描述符一样)程序不可访问的高速缓存寄存器。内容为当前选择子对应的描述符。此后到访问,CPU只要直接读取高速缓存寄存器中保存的某个和TR或者LDTR相对应的描述符即可,而不用再去内存中去寻找。这样可以加快用户任务执行代码和数据寻址的速度。
结束语
CPU工作原理是一个涉及很多计算机基础知识的内容,只有反复思考总结才能理解和融合贯通。如果本文能够解答和帮助到你,使你能够弄清楚你之前某一点的疑惑,也就够了。