概述:
从点击应用到执行 main()
之前,系统进行了以下行为:
-
Load dylibs
:递归映射所有依赖的动态库(dylibs) -
Rebase
:对所有图像进行重设基址 -
Bind
:对所有图像进行绑定 -
Notify ObjC Runtime
:运行时操作 -
Initializers
:初始化
注意:
这里的图像是 Mach-O
中的术语,指所有文件类型。
Mach-O
有三种文件类型
- Executable:应用程序的二进制文件;
- Dylib:动态库;
- Bundle:无法被链接的动态库,只能通过 dlopen() 打开;
所有的Executable
、Dylib
、Bundle
称为Image
。
Loading Dylibs
第一个执行的是加载动态库,首先需要去解析所有依赖的动态库的列表,找到 App
需要的所有 mach-o
文件。找到动态库后,需要打开并读取每个文件,在此过程中,验证 mach-o
文件的有效性,依次注册代码签名。最后对每个 segment
调用 mmap()
方法。
加载一个动态库后需要递归加载每个依赖的动态库,一个 App
大约有 400
多个动态库,其中大部分是系统动态库。
Fix-ups
加载完所有的动态库后,动态库只是一个个单独的存在,此时需要通过 fix-ups
使动态库相互关联。在 __DATA segment
中有一个指针,可以用来跳转。
fix-ups
分为两种,rebase
和 bind
。rebase
是在图像内部调整指针;而 bind
是在图像外部调整指针。
Rebase
因为 ASLR(Address space layout randomization)
使所有动态库被加载到随机地址上,所以需要 rebase
遍历所有的内部数据指针,然后为它们添加一个地址偏移值。
Bind
Bind
针对那些指向动态库之外的指针,这些指针通过名称绑定。运行时,dylb
通过符号名找到实现该符号的位置,主要是遍历查找符号表,当找到时把值存到该数据指针中。
Notify ObjC Runtime
ObjC
是动态语言,可以在运行时通过类名把类实例化,所以在运行时,ObjC
需要维护一张包含所有类与其映射的表格。每个加载类时,在这个全局表格中注册类名。在运行时还会把定义的 Category
插入到方法列表中。
Selector
对于 ObjC
是唯一的。
Initializers
调用所有类的 +(void)load
方法,对所有动态库初始化。需要从下到上初始化,因为上层的一些动态库可能依赖于下层的动态库,所以先初始化下层的动态库保证所有的动态库都可以正确初始化。
当所有的动态库初始化完成后,最终调用主 dylib
程序,也就是 main()
。
总结
Dyld
是一个辅助程序,主要功能
- 加载所有依赖库;
- 修复所有
DATA
页面的指针; - 运行所有构造器初始化,并最终调用
mian()
。