既然谈到objc_msgSend,那就应该会了解到Runtime,那么调用Runtime有三种方式,一种是通过oc
代码调用,二种是Framework&service
,三种是Runtime Api
。
下面将分析一下objc_msgSend
的流程:
我们先创建一个简单的工程,通过clang转换成c++文件,通过查看我们在main.m中调用的方法在c++是如何写的;
clang指令转cpp文件:
clang -rewrite-objc -fobjc-arc -fobjc-runtime=ios-13.0.0 -isysroot /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneSimulator.platform/Developer/SDKs/iPhoneSimulator13.5.sdk main.m
iPhoneSimulator13.5.sdk
版本号为你自己电脑上的模拟器版本sdk。通过路径去查找自己电脑上的模拟器sdk版本号。
代码:
#import <Foundation/Foundation.h>
#import <objc/message.h>
@interface Person : NSObject
- (void)sayHello;
- (void)sayNB;
@end
@implementation Person
- (void)sayNB{
NSLog(@"personNB666");
}
- (void)sayNB{
NSLog(@"personHello666");
}
@end
int main(int argc, const char * argv[]) {
@autoreleasepool {
// insert code here...
// 方法: 消息 : (消息的接受者 . 消息主体)
Person *person = [Person alloc];
[person sayNB];
[person sayHello];
NSLog(@"Hello, World!");
}
return 0;
}
通过转换之后的c++中的main函数代码:
int main(int argc, const char * argv[]) {
/* @autoreleasepool */ { __AtAutoreleasePool __autoreleasepool;
Person *person = ((Person *(*)(id, SEL))(void *)objc_msgSend)((id)objc_getClass("Person"), sel_registerName("alloc"));
((void (*)(id, SEL))(void *)objc_msgSend)((id)person, sel_registerName("sayNB"));
((void (*)(id, SEL))(void *)objc_msgSend)((id)person, sel_registerName("sayHello"));
NSLog((NSString *)&__NSConstantStringImpl__var_folders_8j_s007fc3x0ql411_t5fym84rr0000gn_T_main_4dc776_mi_2);
}
return 0;
}
因此,那么编译之后发现,它并不是用oc的上层方法去调用,而是调用了一些objc_msgSend
函数。
因此,在调用方法时,我们也可以使用Runtime Api的一些方法去实现。
runtime 有三种方式可以通过底层的API往上层发送消息。
通过方法 objc_msgSend去发送消息,但是他是如何找到我们调用的方法呢?
oc方法在底层主要是消息
,而消息内有sel和imp
,通过sel(方法编号)
去找到imp(函数指针地址)
,再通过地址去找到内容。oc层面对比c会慢一点,因为它存在一层转化。
oc方法转消息是通过c函数实现,那么objc_msgSend
怎么通过sel
去找到imp
呢?
objc_msgSend
有一个消息接受者:从对象
->ISA
->方法(类,元类)
->cache_t
->methodList
。
下面我们的重点就是系统是如何通过sel
去找到imp
。
我使用的底层源码为objc4-781源码;在搜索objc_msgSend
,会有下面的列表,我们去寻找我们常见的arm64
;
直接点击下图所示的ENTRY _objc_msgSend
。
下面附上objc_msgSend
汇编代码,一些汇编代码上会有比较多的注释,他们是我写上用于理解的信息:
//进入_objc_msgSend
ENTRY _objc_msgSend
UNWIND _objc_msgSend, NoFrame
//让p0和空对比,在我们在控制台进行调试时,会输入`register read`输出寄存器,p0也就是第一个值。接收传入的值是否为空
cmp p0, #0 // nil check and tagged pointer check
#if SUPPORT_TAGGED_POINTERS
//支持SUPPORT_TAGGED_POINTERS类型,就执行`LNilOrTagged`
b.le LNilOrTagged // (MSB tagged pointer looks negative)
#else
//否则执行`LReturnZero`
b.eq LReturnZero
#endif
//拿出ISA的值赋值给p13
ldr p13, [x0] // p13 = isa
//1、拿出类对象,将class的值赋值给p16,它是如何获取类信息的,详细信息请看下面的解释。
GetClassFromIsa_p16 p13 // p16 = class
//获取ISA完毕
LGetIsaDone:
// calls imp or objc_msgSend_uncached
//2、开始进行从缓存里面获取imp的流程,如何进行这个流程,下面会讲解;
CacheLookup NORMAL, _objc_msgSend
疑难解答:
1、在上面的汇编代码中,如何获取ISA中的类信息?
首先我们来看一下GetClassFromIsa_p16
的源代码,这一段源码的作用就是通过isa & mask获取类的信息,它主要走的是#elif __LP64__
这一步的流程。其流程在isa结构分析有详细介绍:
.macro GetClassFromIsa_p16 /* src */
#if SUPPORT_INDEXED_ISA
// Indexed isa
//将索引信息isa代表的$0数据传送到p16
mov p16, $0 // optimistically set dst = src
tbz p16, #ISA_INDEX_IS_NPI_BIT, 1f // done if not non-pointer isa
// isa in p16 is indexed
adrp x10, _objc_indexed_classes@PAGE
add x10, x10, _objc_indexed_classes@PAGEOFF
ubfx p16, p16, #ISA_INDEX_SHIFT, #ISA_INDEX_BITS // extract index
ldr p16, [x10, p16, UXTP #PTRSHIFT] // load class from array
1:
#elif __LP64__
// 64-bit packed isa
and p16, $0, #ISA_MASK
#else
// 32-bit raw isa
mov p16, $0
#endif
.endmacro
2、从缓存里面获取imp的流程
请先看CacheLookup
的源码,在大多数代码上面会有一些注释,是我附上用于理解的内容,它的主要作用是查找缓存在cache_t中的信息,对于cache_t不熟悉的可以阅读iOS底层cache_t分析:
.macro CacheLookup
LLookupStart$1:
//#CACHE宏定义: #define CACHE (2 * __SIZEOF_POINTER__) [sel+imp = 16]
//p16 平移16字节(类的cache信息前面存在isa,superclass,因此平移16字节),存入p11.
// p1 = SEL, p16 = isa
ldr p11, [x16, #CACHE] // p11 = mask|buckets
#if CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_HIGH_16
//让p11与0x0000ffffffffffff(0-47全为1) 与一下放在p10中,其中p10 = buckets(通过前48位为1与上buckets,得到buckets,前16位为0)
and p10, p11, #0x0000ffffffffffff // p10 = buckets
//逻辑右移,p11逻辑右移48位得到mask,与上p1(_cmd),得到p12
and p12, p1, p11, LSR #48 // x12 = _cmd & mask
#elif CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_LOW_4
and p10, p11, #~0xf // p10 = buckets
and p11, p11, #0xf // p11 = maskShift
mov p12, #0xffff
lsr p11, p12, p11 // p11 = mask = 0xffff >> p11
and p12, p1, p11 // x12 = _cmd & mask
#else
#error Unsupported cache mask storage for ARM64.
#endif
//直接跳到此处,PTRSHIFT = 3, ((_cmd & mask) << (1+PTRSHIFT))为sel<<16 (imp + sel = 16)
add p12, p10, p12, LSL #(1+PTRSHIFT) // p12 = buckets + ((_cmd & mask) << (1+PTRSHIFT))
在得到buckets之后,就会跳转到CheckMiss
:
下面附上CheckMiss
的源码:
.macro CheckMiss
// miss if bucket->sel == 0
.if $0 == GETIMP
cbz p9, LGetImpMiss
.elseif $0 == NORMAL
cbz p9, __objc_msgSend_uncached
.elseif $0 == LOOKUP
cbz p9, __objc_msgLookup_uncached
.else
.abort oops
.endif
.endmacro
当为NORMAL
的情况下,就会跳转__objc_msgSend_uncached
,在__objc_msgSend_uncached中又存在一个MethodTableLookup
方法表,而后会进入到这个方法表中去查找,这一步是重点,由于源码较多,这边只介绍关键方法和代码,在进入方法表之后,就会有一行bl _lookUpImpOrForward
跳转,这一步是慢速查找流程,将在之后的文章介绍。
下面通过一些伪代码来模拟一下整个过程:
[person sayHello] -> imp ( cache -> bucket (sel imp))
// 获取当前的对象
id person = 0x10000
// 获取isa
isa_t isa = 0x000000
// isa -> class -> cache
cache_t cache = isa + 16字节
// arm64
// mask|buckets 在一起的
buckets = cache & 0x0000ffffffffffff
// 获取mask
mask = cache LSR #48
// 下标 = mask & sel
index = mask & p1
// bucket 从 buckets 遍历的开始 (起始查询的bucket)
bucket = buckets + index * 16 (sel imp = 16)
int count = 0
// CheckMiss $0
do{
if ((bucket == buckets) && (count == 0)){ // 进入第二层判断
// bucket == 第一个元素
// bucket人为设置到最后一个元素
bucket = buckets + mask * 16
count++;
}else if (count == 1) goto CheckMiss
// {imp, sel} = *--bucket
// 缓存的查找的顺序是: 向前查找
bucket--;
imp = bucket.imp;
sel = bucket.sel;
}while (bucket.sel != _cmd) // // bucket里面的sel 是否匹配_cmd
// CacheHit $0
return imp
CheckMiss:
CheckMiss(normal)
下面有一张大佬制作的objc_msgSend的流程分析图,这边附上来给需要学习的同学看一下: