iOS进阶02: Mach-O

一、什么是Mach-O文件?

Mach-OMach Object文件格式的缩写,是 mac以及 iOS上可执行文件的格式,对应系统通过应用二进制接口(application binary interface,缩写为ABI)来运行该格式的的文件。Mach-O文件对应有多种格式:

  • 目标文件.o
  • 库文件: .a静态库文件 .dylib动态库文件 .framework文件,自己创建的为静态库文件
  • 可执行文件
  • dyld动态链接器将依赖的动态库加载到内存
  • .dsym符号表

Mach-O格式用来替代BSD系统的a.out格式。Mach-O文件格式保存了在编译过程链接过程中产生的机器代码和数据,从而为静态链接和动态链接的代码提供了单一文件格式。

clang单文件编译

Xcode中我们可以直接创建.c文件,通过终端clang命令来对.c文件进行编译或生成可执行文件,下面看一下clang怎样使用的。

  • 1、创建一个main.c文件如下:
#include <stdio.h>
int main(){
    printf("打印:hello\n");
    return 0;
}
  • 2、编译文件
clang -c main.c

会生成main.o文件,该文件即为mach-o文件,通过命令file main.o查看文件信息如下

main.o: Mach-O 64-bit object x86_64

是一个object类型的文件称为目标文件,并不是可执行文件

  • 3、生成可执行文件

    • 命令clang main.o 会生成a.out文件,即可执行文件,通过ls查看
    • 命令clang -o main main.o 也会生成可执行文件main
    • 命令clang -o main main.c 直接根据源文件生成可执行文件main
    • 命令 size -x -l -m main 查看文件信息,如下:
    image
  • 4、执行文件

./a.out 或 ./main
image

多个文件是如何编译的呢?

开发中根据不同功能模块我们会分很多文件来实现,在clang中是可以对多个文件进行一次性打包,生成一个可执行文件。如下:

  • 1、新建一个功能文件 people.c
#include <stdio.h>
void sleep(){
    printf("正在睡觉\n");
}
  • 2、在main.c中声明sleep方法并调用
void sleep();//声明方法
int main(){
    printf("打印:hello\n");
    sleep();//调用方法
    return 0;
}
  • 3、编译为可执行文件
clang -o main main.c people.c
  • 4、执行可执行文件./main, 运行结果如下:
    image

二、通用二进制文件(Universal binary)

iOS中不同手机对应着可能不同的架构,如arm64、armv7、armv7s。为了兼容不同架构的手机,苹果推出了通用二进制文件,包含了应用程序常用的这些架构,因此通用二进制文件,比单一架构二进制文件要大很多。

架构选择

image

通过以上配置真实编译出来的是包含arm64、armv7架构

通用二进制文件在哪呢?

xxx.app中的xxx黑色文件即是通用二进制文件,右键xxx.app显示包内容即可获得。

lipo命令

通过lipo命令可以查看、拆分及合并以上提出的架构,在做静态库时也会使用,来合并真机下和模拟器下的静态库,以适应不同的调试环境。

LoginApp.app中我获取可执行文件LoginApp

  • 1、查看架构信息: lipo -info LoginApp
// 终端输出结果如下
Architectures in the fat file: LoginApp are: armv7 arm64
  • 2、拆分armv7、arm64架构
lipo LoginApp -thin armv7 -output LoginApp_armv7
lipo LoginApp -thin arm64 -output LoginApp_arm64
// 终端输出结果如下
Non-fat file: LoginApp_armv7 is architecture: armv7
Non-fat file: LoginApp_arm64 is architecture: arm64
  • 3、合并架构
lipo -create LoginApp_armv7 LoginApp_arm64 -output LoginApp_ALL
  • 产生的可执行文件如图:


    image

三、Mach-O文件结构

官方图解:


image

文件分为三个部分:

  • Header:包含Mach-O文件的基本信息,字节顺序、架构类型、加载指令的数量等
  • Load commands:包含区域位置、符号表、动态符号表,加载Mach-O文件时使用这里的数据确定内存分布
  • Data:数据段segment,包含具体代码、常量、类、方法等,有多个segment,每个segment有0到多个section,每个段有一个虚拟地址映射到进程的地址空间

直接使用 MachOView打开LoginApp可执行文件,如下:

image

image

结构体对齐

1、查看Macho headers

// 查看 Header,包括 Load commands
objdump --macho --private-headers LoginApp
otool -l ${MACHO_PATH}
// 只查看 Header
objdump --macho --private-header LoginApp
otool -h ${MACHO_PATH}
image

image

Mach-O中定义了程序的入口main函数(定义在LC_MAIN的Load command命令),告诉动态链接器去加载程序的入口

// grep代表搜索, -A 5:向下输出5行
objdump --macho --private-headers LoginApp | grep "MAIN" -A 5
image
  • 以上打印的两段分别是armv7arm64架构下的header信息 在objc4源码loader.h文件中有mach_header的结构体定义,如下:
struct mach_header {
    uint32_t    magic;      /* mach magic number identifier */
    cpu_type_t  cputype;    /* cpu specifier */
    cpu_subtype_t   cpusubtype; /* machine specifier */
    uint32_t    filetype;   /* type of file */
    uint32_t    ncmds;      /* number of load commands */
    uint32_t    sizeofcmds; /* the size of all the load commands */
    uint32_t    flags;      /* flags */
};
struct mach_header_64 {
    uint32_t    magic;      /* mach magic number identifier */
    cpu_type_t  cputype;    /* cpu specifier */
    cpu_subtype_t   cpusubtype; /* machine specifier */
    uint32_t    filetype;   /* type of file */
    uint32_t    ncmds;      /* number of load commands */
    uint32_t    sizeofcmds; /* the size of all the load commands */
    uint32_t    flags;      /* flags */
    uint32_t    reserved;   /* reserved */
};
  • magic:魔数,确定是64位还是32位
  • cputypecpu类型
  • cpusubtypecpu子类型
  • filetypeMach-O支持多种文件类型,使用filetype来标注具体文件类型
  • ncmds:加载命令的数量
  • sizeofcmds:命令区域(load commands)总的字节大小
  • flags:标识二进制文件所支持的功能,主要与系统的加载、链接有关

2、Load commands

Header之后是load commands段为加载命令段,在header结构体中有对加载命令段相关信息的描述,用于解析加载命令。在objc4源码loader.h中,有对loadcommand的定义:

struct load_command {
    uint32_t cmd;       /* type of load command */
    uint32_t cmdsize;   /* total size of command in bytes */
};
  • cmd:命令类型,针对不同架构有不同的结构(32位、64位)
  • cmdsize:命令所占字节大小(32位size必须为4字节的倍数,64位size必须为8字节的倍数)在文件中有两个结构体segment_commandsegment_command_64针对不同架构的结构体,内部设置字段相同。以segment_command_64为例:
struct segment_command_64 { /* for 64-bit architectures */
    uint32_t    cmd;        /* LC_SEGMENT_64 */
    uint32_t    cmdsize;    /* includes sizeof section_64 structs */
    char        segname[16];    /* segment name */
    uint64_t    vmaddr;     /* memory address of this segment */
    uint64_t    vmsize;     /* memory size of this segment */
    uint64_t    fileoff;    /* file offset of this segment */
    uint64_t    filesize;   /* amount to map from the file */
    vm_prot_t   maxprot;    /* maximum VM protection */
    vm_prot_t   initprot;   /* initial VM protection */
    uint32_t    nsects;     /* number of sections in segment */
    uint32_t    flags;      /* flags */
};
  • cmd:加载命令类型
  • LC_SEGMENT:表示这好似一个段加载命令,需要将它加载到对应的进程空间上
  • LC_LOAD_DYLIB:这是一个需要动态加载的链接库,它使用dylib_command结构体表示
  • LC_MAIN:记录了可执行文件的主函数main()的位置,它使用entry_point_command结构体表示
  • LC_CODE_SIGNATURE:代码签名的加载命令,描述了Mach-O的代码签名信息,它属于链接信息,使用linkedit_data_command结构体表示
  • cmdsize:加载命令所占内存大小
  • segname:存放16字节大小的段名字,当前是__PAGEZERO
  • vmaddr:段的虚拟内存起始地址
  • vmsize:段的虚拟内存大小
  • fileoff:段在文件中偏移量
  • filesize:段在文件大小
  • maxprot:段页面所需要的最高内存保护(4=r,2=w,1=x)
  • initprot:段页面初始的内存保护
  • nsects:段中包含section的数量
  • flags:其他杂项标志位

以上加载命令含义如下:

  • LC_SEGMENT_64:将文件中的段映射到进程地址空间中
  • LC_DYLD_INFO_ONLY:动态链接相关信息
  • LC_SYMTAB:符号表信息,位置、偏移、数据个数,供dyld使用
  • LC_DYSYMTAB:动态符号表信息,供dyld使用
  • LC_LOAD_DYLINKER:链接器信息,记录使用那些链接器完成内核后序的加载工作
  • LC_UUID:Mach-O文件的唯一标识
  • LC_VERSION_MIN_MACOSX:支持最低操作系统版本
  • LC_SOURCE_VERSION:源代码的版本号
  • LC_MAIN:设置主线程的入口
  • LC_LOAD_DYLIB:依赖库信息,dyld通过该命令去加载依赖库
  • LC_FUNCTION_STARTS:函数的起始地址表
  • LC_CODE_SIGNATURE:代码签名

3、Data

Data区域由Segment段和Section节组成:

  • segment主要有__TEXT__DATA组成

  • __text:是主程序代码

    • __stubs__stub_helper:是动态链接的桩
    • __cstring:程序中c语言字符串
    • __const:常量
  • __DATA含义:

    • Section64(__TEXT,__objc_methname):OC类名
    • Section64(__DATA,__objc_classlist):OC类列表
    • Section64(__DATA,__objc_protollist):OC原型列表
    • Section64(__DATA,__objc_imageinfo):OC镜像信息
    • Section64(__DATA,__objc_selfrefs):OC类自引用
    • Section64(__DATA,__objc_superrefs):OC类超类的引用
    • Section64(__DATA,__ivar):OC类成员变量

总结

  • 查看mach-header
    • objdump --macho -private-header ${MACHO_PATH}
    • otool -h ${MACHO_PATH}
  • 查看__TEXT: objdump --macho -d ${MACHO_PATH}
  • 查看符号表: objdump --macho --syms ${MACHO_PATH}
  • 查看导出符号表: objdump --macho --exports-trie ${MACHO_PATH}
  • 查看间接符号表: objdump --macho --indirect-symbols ${MACHO_PATH}
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,602评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,442评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,878评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,306评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,330评论 5 373
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,071评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,382评论 3 400
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,006评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,512评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,965评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,094评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,732评论 4 323
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,283评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,286评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,512评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,536评论 2 354
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,828评论 2 345

推荐阅读更多精彩内容

  • # 动态链接 动态链接的基本思想是把程序按照模块拆分成各个相对独立部分,在程序运行时才将它们链接在一起形成一个完整...
    Tenloy阅读 3,849评论 3 5
  • 什么是Mach-O文件? Mach-O文件是Mach object文件的缩写,它在NeXTSTEP.MacOS,i...
    SharaYuki阅读 4,061评论 3 13
  • 上一篇说到源码经过预处理、编译、汇编之后生成目标文件,这一章介绍一下iOS、Mac OS中目标文件的格式Mach-...
    Tenloy阅读 2,008评论 2 9
  • 熟悉Linux和windows开发的同学都知道,ELF是Linux下可执行文件的格式,PE32/PE32+是win...
    Klaus_J阅读 3,902评论 1 10
  • 推荐指数: 6.0 书籍主旨关键词:特权、焦点、注意力、语言联想、情景联想 观点: 1.统计学现在叫数据分析,社会...
    Jenaral阅读 5,701评论 0 5