这个文集是用来记录 庖丁解牛Linux内核 这个课程的笔记和作业.错误之处,恳请指出.
实验目地
通过这个实验,主要了解到C函数的调用在汇编层面的逻辑.
实验内容
C程序
首先我们准备了一个简单的函数调用的c程序
int g(int x)
{
return x + 3;
}
int f(int x)
{
return g(x);
}
int main(void)
{
return f(8) + 1;
}
通过gcc -S -o main.S main,c -m32,可以获得main.S也就是该段代码的反汇编代码.去掉其中以"."开头的代码,因为这是汇编语言中的伪指令,是写给编译器看的,并不是真正的机器会执行的代码.然后我们得到下面的汇编代码:
g:
pushl %ebp
movl %esp, %ebp
movl 8(%ebp), %eax
addl $3, %eax
popl %ebp
ret
f:
pushl %ebp
movl %esp, %ebp
subl $4, %esp
movl 8(%ebp), %eax # 这里是要跳过call中入栈的eip,跳过前面看入栈的ebp,也就是4*2=8bytes,内存单位是1byte,那么8(%ebp)就是在ebp的基础上往前移8bytes,指向main里的立即数8.
movl %eax, (%esp)
call g
leave
ret
main:
pushl %ebp #从这一句开始执行, 把main函数的栈底地址入栈.
movl %esp, %ebp # 更新栈底地址
subl $4, %esp
movl $8, (%esp) #相当于push $8
call f # push 下条指令eip到栈中,然后修改eip为f的地址,跳到f处开始执行
addl $1, %eax
leave
ret
基本逻辑直接看我上面的注释.下面是几个注意的点
- 要注意的是除了最开始的初始化,esp指向的栈顶是当前有效数据的最低地址,而不是指向null的地址.那么
subl $4, %esp
movl $8, (%esp)
这两句其实就是push $8,为什么要分成两句我还不知道.
总结
- 计算机的工作原理其实就是讲一些代码放在连续的内存里,然后同时开辟一段堆和栈. 堆用来存储全局.
- 我们在调用函数时,在汇编层面的处理是:
- 先把CS:IP压入栈,以便函数结束后再接着当前流程执行
- 再把当前函数的栈顶压入
- 再从右到左压入函数变量