在CSAPP链接相关章节中,书中描述了链接大概分为两步,第一步为符号解析,第二步便是重定位。其中书中描述 (P478) 重定位时会合并各个重定位目标文件中相同类型的节,然后链接器会将运行时内存地址赋给各个节。
书中提到了段要加载到内存时,应该放在的地址保存在程序头部表中(Program header table),它描述了将文件各段映射到运行时内存的一些参数,但并未对运行时地址展开描述。
- 该表记录了数据段,代码段等在文件中的偏移,以及长度,该段要被加载至内存哪个地址,以及对其要求。
猜测:
- 数据段代码段总是被加载至内存固定的位置,即表中记录的地址。
- 被定义的全局符号总是有固定的虚拟内存地址。
- 在重定位的过程中,是计算符号定义的运行时地址(符号定义在内存中的地址),然后通过计算文件内部的这个引用的偏移,将其装填到这里。
=================下面不作数=====================
我们可以进行一个简单的测试:
- 查看这个可执行目标文件的程序头部表,记录下代码段和数据段的 vaddr、paddr,然后执行该文件,查看内存代码段和数据段的地址,是否就是该表所记录的。
- 找一个使用相对地址重定位的引用,取这个引用上的地址,然后将vaddr所记录运行地址代入计算,查看结果是否一致。
对于一个极其简单的C - testA.c 程序:
int test_var = 1;
int main(){
test_var = 10;;
}
将其编译为可重定位目标文件,并查看这个文件的反汇编代码:
>>> gcc -c -o testA.o testA.c
>>> objdump -d -F testA.o
0000000000000000 <main> (File Offset: 0x40):
0: c7 05 00 00 00 00 0a movl $0xa,0x0(%rip) # a <main+0xa> (File Offset: 0x4a)
....
我们可以看到重定位条目,在.text节内偏移 0xa 处需要进行一个重定位,这正是对全局变量 test_var 的引用,而rip存放PC值,这条指令的意思就是把常数 0xa 存放至 PC + addr 这个地址上,而此处的 addr 还未被重定位,就是一串 0。
然后我们将这个可重定位目标文件链个可执行目标文件,然后查看反汇编数据:
>>> gcc -c -o testA.out testA.o
对这个可执行目标文件进行反汇编:
>>> objdump -d -F testA.out
00000000004004d6 <main> (File Offset: 0x4d6):
4004d6: c7 05 50 0b 20 00 0a movl $0xa,0x200b50(%rip) # 601030 <test_var> (File Offset: 0x201030)
...
Disassembly of section .data:
0000000000601030 <test_var> (File Offset: 0x1030):
601030: 01 00 add %eax,(%rax)
...
由于 objdump 反汇编时显示的地址是 complete address (man objdump中所述),不是文件内偏移,可以通过 -F 命令显示出具体指令在文件内部的偏移。
我们查看其程序头部表,挑出数据段与代码段相关信息:
>>> objdump -d -F testA.out
INTERP off 0x0000000000000238 vaddr 0x0000000000400238 paddr 0x0000000000400238 align 2**0
filesz 0x000000000000001c memsz 0x000000000000001c flags r--
LOAD off 0x0000000000000000 vaddr 0x0000000000400000 paddr 0x0000000000400000 align 2**21
filesz 0x0000000000000694 memsz 0x0000000000000694 flags r-x // 代码段
LOAD off 0x0000000000000e10 vaddr 0x0000000000600e10 paddr 0x0000000000600e10 align 2**21
filesz 0x0000000000000224 memsz 0x0000000000000228 flags rw- //数据段