虚拟内存
CPU是如何做到寻址的?
举个例子
#include <stdio.h>
extern void ext();
int main()
{
printf("Hello World\n");
ext();
return 0;
}
对于如上代码,程序运行时是通过0x8049000这个地址找到printf函数的实现:
Dump of assembler code for function main:
0x000000000800063a <+0>: push %rbp
0x000000000800063b <+1>: mov %rsp,%rbp
=> 0x000000000800063e <+4>: lea 0x9f(%rip),%rdi # 0x80006e4
0x0000000008000645 <+11>: callq 0x8049000<puts@plt>
0x000000000800064a <+16>: mov $0x0,%eax
0x000000000800064f <+21>: pop %rbp
---Type <return> to continue, or q <return> to quit---
那么问题来了:
- 0x8049000是物理地址还是虚拟地址?
——答:虚拟地址; - CPU如何找到这个地址对应的数据?
——答:CPU根据虚拟地址做页映射,进而找到物理内存页,再根据数据页内偏移找到最终的函数实现。
虚拟地址
为了说明一条虚拟地址的构成和作用,我们简单通过下面两幅图来介绍。
虚拟地址 vs 虚拟页 vs 物理页
CPU初次访问0x8049000地址流程
Linux下进程虚拟地址空间 vs 数据结构
链接装载
谈到动态链接,我们就不得不谈PLT以及GOT了。
GOT
又名全局偏移表, GOT完全是为了实现“代码地址无关”(PIC)技术,即通过新增对外部符号的指针,从而实现一份动态库代码段无视被任意进程装载到任意地址处,进而解决了共享代码段的复用(相比静态链接,同事节省了磁盘和物理内存)。
PLT
又名过程链接表,PLT实质就是延迟绑定技术的实现,即为了解决动态库间接寻址效率低下的问题,动态库将所有外部引用推迟到运行时装载,而且只在第一次引用符号时进行重定位!
运行时重定位
下面以main程序多次调用ext@plt为例,为大家展示PLT和GOT是如何配合动态链接器实现符号运行时重定位的:
.got一般位于ELF的数据段
main程序调用外部函数ext