一、对象的指针地址和内存
先看下面的代码:
HPerson * p1 = [HPerson alloc];
HPerson * p2 = [p1 init];
HPerson * p3 = [p1 init];
NSLog(@"%@-%p", p1, p1);
NSLog(@"%@-%p", p2, p2);
NSLog(@"%@-%p", p3, p3);
请问这3者的会有什么不同吗?
执行代码就会发现p1,p2,p3
打印的内存地址是完全一样的:
所以在这个过程我们可以得出一个结论:
1、alloc
让对象有了内存空间,有了指针指向。
2、init
后内存没有变化,证明init
没有对指针做什么操作。
再来看下面的代码:
HPerson * p1 = [HPerson alloc];
HPerson * p2 = [p1 init];
HPerson * p3 = [p1 init];
NSLog(@"%@-%p-%p", p1, p1, &p1);
NSLog(@"%@-%p-%p", p2, p2, &p2);
NSLog(@"%@-%p-%p", p3, p3, &p3);
执行:
发现3个不同的指针地址指向了同一块内存空间,而且是3个连续的指针地址。
那么alloc
是怎么分配内存空间的呢?init
真的什么都没有做吗?
二、探索底层的三种方法
如果我们直接进行代码跳转:
就会进入到NSObject
的alloc
方法:
发现找不到方法的实现!
为什么没有实现呢?我们应该如何去查看alloc
方法的实行呢?
方法一:断点调试
我们先在alloc
处打上断点:
然后按住ctrl
点击step into
:
即可看到,
alloc
方法调用的是objc_alloc
方法:
然后我们打上符号断点:
再点击继续执行程序:
然后我们就会发现objc_alloc
来源于libobjc.A.dylib
,即objc
动态库底层方法:
方法二:利用汇编一步一步跟进
在debug
选择栏打开进入汇编:
依旧在alloc
处打上断点:
运行程序就会进入到汇编页面:
在该页面就会发现是调用了objc_alloc
方法,然后用符号断点去查看该方法使用的哪个动态库。
方法三:通过已知方法进行符号断点
当程序停在我们的断点处时:
添加已知方法的符号断点:
然后进入:
就会发现alloc
是来自libobjc.A.dylib
动态库:
以上就是3中基本的探索底层的方式,还有反汇编、lldb、堆栈
等等。
三、汇编结合源码调试分析
1、下载源码
我们已经定位到了alloc
是在libobjc
这个动态库里面,接下来就是进入源码进行调试。
先在苹果开源网站下载源码,或者在苹果的源代码目录进行下载,源代码目录更加方便。
以源代码目录为例:
进入网站后搜索objc
:
找到objc4
,点进去:
最新的objc4-824.tar.gz有问题,无法下载,所以使用的是objc4-818.2.tar.gz。
2、查看源码
打开下载的objc4-818.2,搜索alloc {
:
发现alloc
方法里面调用的是_objc_rootAlloc
方法。
再点_objc_rootAlloc
方法进去:
// Base class implementation of +alloc. cls is not nil.
// Calls [cls allocWithZone:nil].
id
_objc_rootAlloc(Class cls)
{
return callAlloc(cls, false/*checkNil*/, true/*allocWithZone*/);
}
发现_objc_rootAlloc
方法里面是callAlloc
方法。
再点callAlloc
方法进去:
// Call [cls alloc] or [cls allocWithZone:nil], with appropriate
// shortcutting optimizations.
static ALWAYS_INLINE id
callAlloc(Class cls, bool checkNil, bool allocWithZone=false)
{
#if __OBJC2__
if (slowpath(checkNil && !cls)) return nil;
if (fastpath(!cls->ISA()->hasCustomAWZ())) {
return _objc_rootAllocWithZone(cls, nil);
}
#endif
// No shortcuts available.
if (allocWithZone) {
return ((id(*)(id, SEL, struct _NSZone *))objc_msgSend)(cls, @selector(allocWithZone:), nil);
}
return ((id(*)(id, SEL))objc_msgSend)(cls, @selector(alloc));
}
这里就是alloc
的核心方法。
__OBJC2__
指的是2.0版本,现在用的都是2.0版本。
那么到了这里,是执行_objc_rootAllocWithZone
呢?还是执行objc_msgSend
呢?
3、汇编调试
我们可以通过汇编来查看,回到最开始的代码,在alloc
处打上断点,于此再加上_objc_rootAlloc
的符号断点:
运行:
运行后确实进入了_objc_rootAlloc
方法,但是进入却是HPerson
的父类NSObject
的_objc_rootAlloc
方法,我们应该进入的HPerson
的方法才对!
所以需要先取消_objc_rootAlloc
的断点重新运行,当断到了HPerson
的alloc
方法时,再加上_objc_rootAlloc
的断点:
断住后,发现先执行_objc_rootAllocWithZone
方法,再执行objc_msgSend
方法。
4、源码调试
先按照iOS_objc4-756.2 最新源码编译调试配置下载下来的objc4-818.2。
在objc
源码里面创建HObjectBuild
这个targets
,并创建HPerson
这个类:
在main.m
里面打上断点,并运行程序:
进入上面查看到的_objc_rootAllocWithZone
方法里:
NEVER_INLINE
id
_objc_rootAllocWithZone(Class cls, malloc_zone_t *zone __unused)
{
// allocWithZone under __OBJC2__ ignores the zone parameter
return _class_createInstanceFromZone(cls, 0, nil,
OBJECT_CONSTRUCT_CALL_BADALLOC);
}
再进入到_class_createInstanceFromZone
方法里:
/***********************************************************************
* class_createInstance
* fixme
* Locking: none
*
* Note: this function has been carefully written so that the fastpath
* takes no branch.
**********************************************************************/
static ALWAYS_INLINE id
_class_createInstanceFromZone(Class cls, size_t extraBytes, void *zone,
int construct_flags = OBJECT_CONSTRUCT_NONE,
bool cxxConstruct = true,
size_t *outAllocatedSize = nil)
{
ASSERT(cls->isRealized());
// Read class's info bits all at once for performance
bool hasCxxCtor = cxxConstruct && cls->hasCxxCtor();
bool hasCxxDtor = cls->hasCxxDtor();
bool fast = cls->canAllocNonpointer();
size_t size;
size = cls->instanceSize(extraBytes);
if (outAllocatedSize) *outAllocatedSize = size;
id obj;
if (zone) {
obj = (id)malloc_zone_calloc((malloc_zone_t *)zone, 1, size);
} else {
obj = (id)calloc(1, size);
}
if (slowpath(!obj)) {
if (construct_flags & OBJECT_CONSTRUCT_CALL_BADALLOC) {
return _objc_callBadAllocHandler(cls);
}
return nil;
}
if (!zone && fast) {
obj->initInstanceIsa(cls, hasCxxDtor);
} else {
// Use raw pointer isa on the assumption that they might be
// doing something weird with the zone or RR.
obj->initIsa(cls);
}
if (fastpath(!hasCxxCtor)) {
return obj;
}
construct_flags |= OBJECT_CONSTRUCT_FREE_ONFAILURE;
return object_cxxConstructFromClass(obj, cls, construct_flags);
}
在_class_createInstanceFromZone
方法内,发现返回的是obj
这个对象,所以我们在obj
这里打上断点:
继续执行程序:
发现obj
已经有地址了,因为当前内存并未使用过,是脏内存地址!
点击step over
,到calloc
方法,内存地址没有发生变化:
在点击step over
,执行完calloc
方法后,发现obj
的内存地址不一样了:
说明在calloc
方法中对obj
进行了内存地址赋值。
在打印中发现obj
对象的类型是id
,这是因为这个地址还没有绑定到我们的HPerson
这类里面去,关联类的是isa
!
继续执行,过了initInstanceIsa
方法后再打印发现obj
已经关联了HPerson
类:
所以在initInstanceIsa
方法内让isa
关联了HPerson
以及c++
的方法和函数!
接下来就是返回obj
,所有的alloc
方法流程已经走完了!
四、字节对齐
重新运行,在_class_createInstanceFromZone
方法的
size = cls->instanceSize(extraBytes);
打上断点:
发现需要额外增加的字节为
0
。
然后进入到instanceSize
方法:
inline size_t instanceSize(size_t extraBytes) const {
if (fastpath(cache.hasFastInstanceSize(extraBytes))) {
return cache.fastInstanceSize(extraBytes);
}
size_t size = alignedInstanceSize() + extraBytes;
// CF requires all objects be at least 16 bytes.
if (size < 16) size = 16;
return size;
}
在return
处打上断点,继续:
发现进入到第一个return
,说明有缓存
。
然后进入fastInstanceSize
方法:
size_t fastInstanceSize(size_t extra) const
{
ASSERT(hasFastInstanceSize(extra));
if (__builtin_constant_p(extra) && extra == 0) {
return _flags & FAST_CACHE_ALLOC_MASK16;
} else {
size_t size = _flags & FAST_CACHE_ALLOC_MASK;
// remove the FAST_CACHE_ALLOC_DELTA16 that was added
// by setFastInstanceSize
return align16(size + extra - FAST_CACHE_ALLOC_DELTA16);
}
}
在return
处打上断点,继续:
走的是第二个
return
,而且size
为16
。
那么这个数据怎么来的呢?
如果没有缓存的话,就会走alignedInstanceSize
方法,然后返回字节对齐的内存大小:
那么,一个对象的内存大小由什么来确定呢?
只有成员变量
决定!
我们进入unalignedInstanceSize
方法:
// May be unaligned depending on class's ivars.
uint32_t unalignedInstanceSize() const {
ASSERT(isRealized());
return data()->ro()->instanceSize;
}
发现大小是有instanceSize
来决定的,即实例变量
的大小!
depending on class's ivars.-->取决于类的ivars。
并且是编译完成的干净内存的大小!
所以是依赖于成员变量
的大小!
当前的HPerson
对象没有成员变量
,所以这里返回的大小是8
:
为什么是8
呢?因为NSObject
有一个成员变量isa
:
为什么isa
的大小是8
呢?
因为Class
是一个结构体
!isa
是一个结构体指针
,所以是8
字节!
我们可以在源码里搜索objc_class
:
发现Class
是一个结构体指针
类型!
而且objc_class
继承于objc_object
,即万物皆对象!即类也是一个对象!
返回大小8
字节后,如果小于16
字节则等于16
:
所以得出16
字节!
如果大于16
呢?
就会进行字节对齐
!
进入到alignedInstanceSize
方法:
// Class's ivar size rounded up to a pointer-size boundary.
uint32_t alignedInstanceSize() const {
return word_align(unalignedInstanceSize());
}
里面有word_align
方法:
static inline uint32_t word_align(uint32_t x) {
return (x + WORD_MASK) & ~WORD_MASK;
}
这个就是字节对齐
算法!
点进WORD_MASK
:
#ifdef __LP64__
# define WORD_SHIFT 3UL
# define WORD_MASK 7UL
# define WORD_BITS 64
#else
# define WORD_SHIFT 2UL
# define WORD_MASK 3UL
# define WORD_BITS 32
#endif
发现WORD_MASK
等于7
!
按照(x + WORD_MASK) & ~WORD_MASK
这个算法,x
为8
:
(x + WORD_MASK) & ~WORD_MASK
= (8 + 7) & ~7
= 15 & ~7
转为二进制:
15 为:0000 1111
7 为:0000 0111
~7 为:1111 1000
所以:
15 & ~7
= 0000 1111 & 1111 1000
= 0000 1000
转为十进制为:8
但是为9
的时候则为16
!
所以这是一个以8
字节对齐,向上取8的整数的方法!
为什么是8
的倍数呢?
因为最大就是指针
,8
字节!同时也是为了空间换时间,方便内存读取!
五、对象的内存空间
先给HPerson
添加对象:
打上断点,运行,然后在lldb
中输入x p
,显示对象p
的内存分布:
0x108f079c0
是对象p
的内存首地址,接下来就是对象p
的内存。
iOS端为小端模式
,所有需要倒着读取:
内存打印出来是什么呢?
是isa
!
为什么没有打印出isa
呢?
因为要&ISA_MASK
:
# if __arm64__
// ARM64 simulators have a larger address space, so use the ARM64e
// scheme even when simulators build for ARM64-not-e.
# if __has_feature(ptrauth_calls) || TARGET_OS_SIMULATOR
# define ISA_MASK 0x007ffffffffffff8ULL
# else
# define ISA_MASK 0x0000000ffffffff8ULL
# endif
这里使用的是模拟器,所以&0x0000000ffffffff8
:
现在就正确的打印出
isa
了!
后面的0
则为对象的属性的存储空间!
进入debug
查看一下内存:
输入内存首地址:
发现即使没有给属性赋值,依旧会开辟内存!
给属性赋值后再运行:
x/5gx
为格式化输出!
如果把height
改为BOOL
类型:
就会发现age
和height
放在了一起!
这是苹果的底层对内存进行了优化,即内存对齐
!