80386保护模式本质

本文试图用有限的篇幅来阐述80386保护模式重要知识点。本文不是一个系统全面的知识介绍，您可能需要了解相关的80386汇编，微型计算机原理和C语言知识。

适合读者：需要了解8386 CPU工作模式，适合正在学习微机原理的同学和准备阅读Linux内核代码的码农。想自己做一个操作系统的同学也可以从本文中获得一些知识储备。

关于80386寻址

什么是寻址

这里说的寻址（addressing）是指CPU内部如何计算物理内存地址（位置）的过程。CPU要处理的数据和代码总是在内存中存取的（暂不讨论CPU缓存），了解一个CPU是如何定位和计算内存地址是理解CPU工作原理的基础。80386采用分段分页来管理内存，之所以没有被设计成固定内存位置寻址（内存位置固定标记，CPU按固定地址存取）有很多原因：

为什么要分段

对8086来说：CPU是16位的，CPU只能处理16位的地址，而其地址总线却有20位。只有通过分段才能访问所有地址。(SS * 16 + SP最大可以表示20位地址, SS：段地址，SP：偏移地址)。之所以要设计20位地址总线，是因为8086的设计目标是支持最大1M内存。
分段机制不让程序直接访问物理内存地址，可以让程序使用的内存地址虚拟化。这种机制可以让操作系统更加灵活和方便管物理内存地址，增加物理内存地址利用率。
对80X86来说：保护模式中的分段分页使得内存使用和分配更加灵活。本篇中下面章节会有详细论述。

8086寻址方式

8086中，程序使用的地址（逻辑地址），是由16位的段地址和16位的段内偏移组成。段地址保存在用户程序中，程序加载时被加载在段寄存器内。之后程序中指令直接使用段内偏移地址（也叫段内偏移量）即可。CPU在寻址（如何计算得到物理内存地址）时会经过如下步骤：

取得该程序加载在段寄存器中的段地址；
取得当前指令使用的偏移地址；
将#1和#2中的地址使带入公式A计算得出得到物理内存地址。
其中公式A可归纳成SS * 16 + SP。

80386寻址方式

80386与8086只是公式A 有所不同的。80386的逻辑地址同样也由两部分组成：16位段选择子和32位段内偏移。寻址步骤如下：

取得该程序的段选择子，同样也是加载在段寄存器中；
取得当前指令使用的偏移地址；
将#1和#2中的地址带入公式A计算得出得到物理内存地址（如果没有分页）
注意：段选择子其实同样被加载在16位段寄存器中，只是80386中我们用了个不同的名字，后面章节会解释为什么取这个名字。

从上面2点可以看出从8086到80386CPU寻址方式总体没有差别。它们都是通过段寄存器和偏移地址来寻址，寻址方式都可表示成:
物理地址＝段寄存器[段内偏移]
从8086到80386所不同的是，上面的步骤3中的公式A和偏移地址长度发生了变化。

8086步骤#3中的地址公式A如下:
20位的物理地址 = 段地址(16位) * 16 + 段内偏移(16位)
一般教科书都有类似这样的表述：段地址左移四位＋偏移地址形成20位物理地址。左移4位相当于乘以16（2的4次方），这里16也经常被写成16进制形式10h。

而80386步骤#3中的地址公式A是这样的:

根据段选择子内容找到段基地址(32位)
用下面公式计算得到32位物理地址:
32位物理地址 = 段基地址(32位) + 段内偏移(32位)

之所以在80386中，段地址叫选择子是因为段基地址是由段寄存器中的内容选择指定的。
需要指出的是80386还多了一个分页的功能，这个功能是可选的。如果启用分页功能（本文最后会对分页详细描述），通过上面步骤计算得到地址叫做线性地址，CPU要进一步处理才能得到最终的物理地址。

重要寄存器和数据结构

本节内容需要花一定的时间去记忆和理解，难点在于只有同时理解并记住这些概念才能融汇贯通。这只有反复阅读和思考才能做到。建议阅读中遇到难以理解的问题可以先了解个大概后跳过，等到需要理解具体相关内容时，再返回来仔细阅读和理解。

描述符(Descriptor）

具有固定长度的结构体(struct)，共８个字节。这个结构体保存着一个段基地址的所有信息，包含：

段基地址
段长度
段属性

描述符有两种，这两种结构体包含的内容几乎都一样，只有一些细小的差别，这两种描述符分别是：

非系统描述符：用来描述数据段，代码段和堆栈段的结构；
系统段描述符：用来描述LDT和TSS的，（LDT和TSS在后面有说明）。

全局描述符表(GDT: Global Descripter Table)

顾名思义，它是一个表结构。这个表存储在内存中，相当于C语言中的一个结构体数组。数组的每一项就是上面所说的描述符。GDT在一个多任务系统中一般只设置一个，其基址由一个GDTR确定（GDT靠GDTR定位），GDT地址在设置好之后几乎不会被改变。这个表中可以包含如下四种信息的描述符：

全局数据段，代码段和堆栈段信息。这些段一般由操作系统内核使用。
对LDT的描述，这个描述符的基址就是是LDT所在内存中的起始地址
对TSS的描述，这个描述符的基址是TSS所在内存中的起始地址
一些门描述符（调用门，中断门等…）。
其中#1属于非系统段描述符，#2 #3 #4属于系统段描述符。描述符各自的属性值决定了它们具体是哪类描述符。其中，LDT，TSS属于具体每个任务，一般成对出现在GDT中。

全局描述符表寄存器(GDTR：Global Descripter Table　Register)

GDTR是一个CPU寄存器，和AX BX.. CS DS...一个概念。GDTR共48位，包含两部分内容：

开头32位用来保存一个内存地址，指出GDT在内存中的位置（如果没有开启分页，它就是一个32位的物理地址）；
随后16位为GDT的长度信息，即GDT共有有多少项。

局部描述符表(LDT：Local Descripter Table)

与GDT的结构类似，所不同的是，LDT用来描述每个具体用户任务代码段，堆栈段和数据段信息。LTD是针对每个用户任务的，类似TSS这样的全局信息相关的描述项自然只存在GDT中，LDT中不会有。LDT描述项一般和正在运行的用户任务数相等。每个用户任务都可能有自己的LDT，保存着本任务相关信息。LDT的基址作为一条记录保存在GDT中（参见上面GDT#2）。

局部描述符表寄存器(LDTR：Global Descripter Table Register)

LDTR也是一个寄存器，和GDTR类似，不同的是它只有16位。LDTR中存放的是一个16位选择子，寻址时用选择子内容去GDT中定位寻找LDT的基址。LDTR当作为选择子，任务切换时只要改变其中存放的选择子内容就能实现LDT的切换。

任务寄存器(TR：Task Register)

也是一个16为的选择子，作用和LDTR类似，都是用来索引全局描述符表(GDT)中的一项。所不同的是TR选择和指向的是一个任务状态段地址（TSS:Task Status Segment）。

任务状态段(TSS：Task State Segment)

正如前文所说，任务状态段（TSS）信息是在GDT中描述的。任务状态段也是是内存中的一个数据结构。这个结构中保存着和任务相关的信息。当运行着的任务准备切换时，CPU会把当前任务用到的寄存器内容（CS EIP DS SS...）包括LDT的选择子等信息保存在TSS中以便任务切换回来时候继续使用。

选择子(Selector)

前文相关内容已经多次提及选择子，选择子按照用途共有三种，其格式完全一样，仅仅用途不同。

TR中的选择子，指向GDT中一个TSS的描述项。
LDTR中的选择子，指向GDT中一个LDT的描述项。
用户程序中的逻辑地址组成部分（这个地址即虚拟地址48位=16位选择子+32位偏移地址)。它用来选择程序用到的数据段，代码段等在LDT中的描述项。此处的选择子由编译，连接或者操作系统决定的。
80386中除了上述寄存器以外，还有一些用户程序不可访问的高速缓冲寄存器寄存器，为的是提高CPU计算性能。为了简化问题我们暂时可以忽略它的存在。

分页机制

控制寄存器（Control Registor）CR3中保存着一个页基址A，如果分页被启用，线性地址经需要经过两级页变换成最终的物理地址：具体过程见下图.

分页机制

参见上图，线性地址从高到底被分成三个部分高10位B，中间10位C，末12位D。变换过程不再描述，语言描述可能看上去复杂，图表相对清晰，这里结合上图给出一个变换过程公式，结合上图应该可以比较清楚的看出分页机制。

页基址 = A;
页基址 = 页基址 + B * 4;  /* 查一级目录页表,在（页基址+B*4）处取得二级页表的的基址,这里等号代表查表 */
页基址 = 页基址 + C * 4;  /* 查二级目录页表,在（页基址+B*4）处取得物理基址,这里等号代表查表 */
物理地址 = 物理基址 + D;

上述公式中B和C为什么要乘以4？因为页表按4位对齐的。页目录项后四位不用。
类似的，GDT/LDT中一项长度为8字节，选择子去GDT/LDT中索引如下：
描述符地址 = Base + Selector * 8.

80386内存管理和任务切换过程

一个80386操作系系统中运行两个用户任务A和B，如图：
任务A运行时CPU和内存状态如下

任务A运行时CPU和内存状态

切换到任务B运行时，CPU和内存状态如下

切换到任务B运行时CPU和内存状态

为了简化问题，上图没有画出隐藏寄存器的使用情况。实际上，TR，LDTR之后都有一个64位（内容和描述符一样）程序不可访问的高速缓存寄存器。内容为当前选择子对应的描述符。此后到访问，CPU只要直接读取高速缓存寄存器中保存的某个和TR或者LDTR相对应的描述符即可，而不用再去内存中去寻找。这样可以加快用户任务执行代码和数据寻址的速度。

结束语

CPU工作原理是一个涉及很多计算机基础知识的内容，只有反复思考总结才能理解和融合贯通。如果本文能够解答和帮助到你，使你能够弄清楚你之前某一点的疑惑，也就够了。

最后编辑于：2017.12.03 08:15:00

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 211,265评论 6赞 490
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 90,078评论 2赞 385
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 156,852评论 0赞 347
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 56,408评论 1赞 283
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 65,445评论 5赞 384
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,772评论 1赞 290
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,921评论 3赞 406
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,688评论 0赞 266
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,130评论 1赞 303
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,467评论 2赞 325
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,617评论 1赞 340
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,276评论 4赞 329
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,882评论 3赞 312
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,740评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,967评论 1赞 265
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 46,315评论 2赞 360
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 43,486评论 2赞 348

80386保护模式本质

关于80386寻址

什么是寻址

为什么要分段

8086寻址方式

80386寻址方式

重要寄存器和数据结构

描述符(Descriptor）

全局描述符表(GDT: Global Descripter Table)

全局描述符表寄存器(GDTR：Global Descripter Table Register)

局部描述符表(LDT：Local Descripter Table)

局部描述符表寄存器(LDTR：Global Descripter Table Register)

任务寄存器(TR：Task Register)

任务状态段(TSS：Task State Segment)

选择子(Selector)

分页机制

80386内存管理和任务切换过程

结束语

推荐阅读更多精彩内容

全局描述符表寄存器(GDTR：Global Descripter Table　Register)