前言
OC在生成对象时需要用到alloc方法,那么alloc方法的底层原理是怎样的呢?今天就来探索下alloc底层流程。
首先做个小测试:
分别输出对象的内容、对象的地址以及对象指针的地址,代码和打印结果如下:
XJPerson *p1 = [XJPerson alloc];
XJPerson *p2 = [p1 init];
XJPerson *p3 = [p1 init];
XJPerson *p4 = [XJPerson alloc];
NSLog(@"%@-%p-%p", p1, p1, &p1);
NSLog(@"%@-%p-%p", p2, p2, &p2);
NSLog(@"%@-%p-%p", p3, p3, &p3);
NSLog(@"%@-%p-%p", p4, p4, &p4);
********************** 运行结果 ************************
2021-06-06 15:13:30.196346+0800 alloc&init探索[1950:46211] <XJPerson: 0x60000295a5a0>-0x60000295a5a0-0x7ffee3355068
2021-06-06 15:13:30.196493+0800 alloc&init探索[1950:46211] <XJPerson: 0x60000295a5a0>-0x60000295a5a0-0x7ffee3355060
2021-06-06 15:13:30.196607+0800 alloc&init探索[1950:46211] <XJPerson: 0x60000295a5a0>-0x60000295a5a0-0x7ffee3355058
2021-06-06 15:13:30.196699+0800 alloc&init探索[1950:46211] <XJPerson: 0x60000295a620>-0x60000295a620-0x7ffee3355050
由打印分析可得出:
-
p1、p2、p3
对象的内容、对象的地址是一样的,但是指针的地址不一样。 -
p4
和p1、p2、p3
打印的对象内容、对象地址、指针地址都不一样。
为什么呢?原因如下图
由此可得出结论:
-
alloc
方法具有开辟内存的功能,而init
方法没有开辟内存的功能。 - 栈区分配的内存是从高到低连续,堆区分配的内存则是从低到高。
下面正式开始探索对象在初始化时,alloc方法到底做了什么?
准备工作:
- 下载源码objc-818.2。
- 编译源码objc4-750源码编译,仅供参考
三种探索底层的方式:
想要探索alloc
的流程,但是Xcode并不能直接看到alloc
的具体实现,下面提供三种探索底层的方式。
1.符号断点
在alloc方法打好断点,当断点断住之后按住control
+ step into
跳进汇编代码查看底层方法调用顺序(新项目会有更多的汇编代码,编译过的项目只有很少的汇编代码),然后再添加通过汇编已知的符号断点探索。流程如下图:
2.汇编
当断点断住之后,通过Xcode
-> Debug
-> Debug Workflow
-> Always Show Disassembly
,打开汇编调试,通过 control
+ step into
跟流程或者直接通过添加汇编代码里的符号断点探索。
备注:Build Setting
-> Optimization Level
可以更改编译优化级别,不同编译优化级别显示的汇编代码多少不同,编译优化级别越高,显示汇编代码越少。
3.符号断点
在需要探索的方法处添加符号断点,比如这里需要探索alloc
方法就直接添加alloc
的符号断点,但是需要注意,在需要的时候才激活此符号断点,不然很多地方都会调用,影响我们探索。
终极方法:源码调试
上面的三种方法为我们探索底层提供了途径,但是都比较繁琐,而且不够清晰,既然已经通过汇编知道objc_alloc
是属于 libobjc.A.dylib
,那么就到苹果开源网站下载objc
源码编译成项目跑起来进行探索,这样既深又爽。
通过汇编调试方式知道源码所在库之后,可以直接到苹果开源网站 https://opensource.apple.com/tarballs/ 下载相关源码然后运行调试。
alloc源码探索
通过源码项目探索alloc方法,发现底层调用流程如下图
探索流程如下:
断点断住alloc
方法之后,按住control
+ command
+ step into
进入alloc
(此方法比加断点的方法更方便快捷且不用担心受其他影响)
+ (id)alloc {
return _objc_rootAlloc(self);
}
继续上面操作进入_objc_rootAlloc
id _objc_rootAlloc(Class cls)
{
return callAlloc(cls, false/*checkNil*/, true/*allocWithZone*/);
}
继续上面操作进入callAlloc
static ALWAYS_INLINE id
callAlloc(Class cls, bool checkNil, bool allocWithZone=false)
{
#if __OBJC2__ // 判断是否为Objc2.0版本
//slowpath(x):x很可能为假,为真的概率很小
//fastpath(x):x很可能为真
//其实将fastpath和slowpath去掉是完全不影响任何功能,写上是告诉编译器对代码进行优化
if (slowpath(checkNil && !cls)) return nil;
//判断该类是否实现自自定义的 +allocWithZone,没有则进入if条件句
if (fastpath(!cls->ISA()->hasCustomAWZ())) {
return _objc_rootAllocWithZone(cls, nil);
}
#endif
// No shortcuts available.
if (allocWithZone) {
return ((id(*)(id, SEL, struct _NSZone *))objc_msgSend)(cls, @selector(allocWithZone:), nil);
}
return ((id(*)(id, SEL))objc_msgSend)(cls, @selector(alloc));
}
按照调用顺序继续上面操作进入_objc_rootAllocWithZone
NEVER_INLINE
id
_objc_rootAllocWithZone(Class cls, malloc_zone_t *zone __unused)
{
// allocWithZone under __OBJC2__ ignores the zone parameter
return _class_createInstanceFromZone(cls, 0, nil,
OBJECT_CONSTRUCT_CALL_BADALLOC);
}
继续上面操作进入_class_createInstanceFromZone
,这里就是真正的核心代码了。
[图片上传失败...(image-77e1eb-1630464921920)]
通过实际调试发现对obj有较大影响的核心方法有3个:
-
cls->instanceSize(extraBytes)
:计算所需内存空间的大小,extraBytes此处为0 -
(id)calloc(1, size)
:向系统申请开辟内存,返回地址指针 -
obj->initInstanceIsa(cls, hasCxxDtor)
:通过isa
关联到相应的类
下面重点分析这三个方法:
instanceSize
:计算所需内存空间的大小
继续上面操作进入instanceSize
inline size_t instanceSize(size_t extraBytes) const {
if (fastpath(cache.hasFastInstanceSize(extraBytes))) {
return cache.fastInstanceSize(extraBytes);
}
size_t size = alignedInstanceSize() + extraBytes;
// CF requires all objects be at least 16 bytes.
if (size < 16) size = 16;
return size;
}
继续上面操作进入cache.fastInstanceSize
size_t fastInstanceSize(size_t extra) const
{
ASSERT(hasFastInstanceSize(extra));
if (__builtin_constant_p(extra) && extra == 0) {
return _flags & FAST_CACHE_ALLOC_MASK16;
} else {
size_t size = _flags & FAST_CACHE_ALLOC_MASK;
// remove the FAST_CACHE_ALLOC_DELTA16 that was added
// by setFastInstanceSize
return align16(size + extra - FAST_CACHE_ALLOC_DELTA16);
}
}
继续上面操作进入align16
(16字节对齐)
static inline size_t align16(size_t x) {
return (x + size_t(15)) & ~size_t(15);
}
探究下align16
方法的具体实现,以align16(12)为例
x = 12;
(x + size_t(15)) & ~ size_t(15) // ~ 表示取反
12 + 15 = 27 0001 1011
15 0000 1111
~15 1111 0000
27 & ~15 0001 1011 & 1111 0000
结果: 0001 0000 16
总结:align16
算法实际上就是取16的整数倍。我认为是向下取整,理由我是站在纯算法的角度,(x + 15)是16的几倍,超过的部分抹去。例如 (20 + 15) = 35 = 16 * 2 + 3,结果是32。这种算法和 >> 4 << 4 是一样的,得出的结果就是16的倍数,不足16的全部抹去。
为什么需要16
字节对齐?
- 数据以字节对齐的方式存储,
cpu
读取数据时以固定字节长度来读取就可以了,不用频繁变换读取字节长度,这是一种以空间换时间的做法。 - 更安全 由于在一个对象中isa指针是占8个字节,如果不进行节对齐 ,对象之间就会紧挨着,容易造成访问混乱。16字节对齐,会预留部分空间,访问更安全
calloc
:向系统申请开辟内存,返回地址指针
首先由instanceSize
方法计算出需要的内存大小,然后向系统申请size
大小的内存空间返回给obj
,因此obj
是指向内存地址的指针,下面我们通过打印来验证下
执行
calloc
之后打印的地址发生了变换,说明系统分配了内存,但是和常见的对象打印<XJPerson: 0x0000000100616e60>
不一样,为什么呢?
-
obj
没有和cls
进行关联绑定。 - 同时验证了
calloc
只是开辟了内存。
initInstanceIsa
:通过isa
关联到相应的类
继续上面操作进入objc_object::initInstanceIsa
inline void
objc_object::initInstanceIsa(Class cls, bool hasCxxDtor)
{
ASSERT(!cls->instancesRequireRawIsa());
ASSERT(hasCxxDtor == cls->hasCxxDtor());
initIsa(cls, true, hasCxxDtor);
}
继续上面操作进入objc_object::initIsa
inline void
objc_object::initIsa(Class cls, bool nonpointer, UNUSED_WITHOUT_INDEXED_ISA_AND_DTOR_BIT bool hasCxxDtor)
{
ASSERT(!isTaggedPointer());
isa_t newisa(0);
if (!nonpointer) {
newisa.setClass(cls, this);
} else {
ASSERT(!DisableNonpointerIsa);
ASSERT(!cls->instancesRequireRawIsa());
#if SUPPORT_INDEXED_ISA
ASSERT(cls->classArrayIndex() > 0);
newisa.bits = ISA_INDEX_MAGIC_VALUE;
// isa.magic is part of ISA_MAGIC_VALUE
// isa.nonpointer is part of ISA_MAGIC_VALUE
newisa.has_cxx_dtor = hasCxxDtor;
newisa.indexcls = (uintptr_t)cls->classArrayIndex();
#else
newisa.bits = ISA_MAGIC_VALUE;
// isa.magic is part of ISA_MAGIC_VALUE
// isa.nonpointer is part of ISA_MAGIC_VALUE
# if ISA_HAS_CXX_DTOR_BIT
newisa.has_cxx_dtor = hasCxxDtor;
# endif
newisa.setClass(cls, this);
#endif
newisa.extra_rc = 1;
}
// This write must be performed in a single store in some cases
// (for example when realizing a class because other threads
// may simultaneously try to use the class).
// fixme use atomics here to guarantee single-store and to
// guarantee memory order w.r.t. the class index table
// ...but not too atomic because we don't want to hurt instantiation
isa = newisa;
}
通过step over
跟流程发现newisa.setClass(cls, this)
之后内存就与类关联起来了。
备注:具体的isa
结构和源码探索请见OC底层原理初探之对象的本质(三)alloc探索下
在obj->initInstanceIsa(cls, hasCxxDtor)
之后打印obj
根据打印结果得出结论:指针和类已经关联起来了。至此alloc
的探索也就告一段落了。
总结:alloc
的核心作用就是分配内存,并通过isa
指针与类进行关联。