1、内存五大区
- 栈(stack):变量地址存放在栈区
NSLog(@"************栈区************");
// 栈区
int a = 10;
int b = 20;
NSObject *object = [NSObject new];
NSLog(@"a == \t%p",&a);
NSLog(@"b == \t%p",&b);
NSLog(@"object == \t%p",&object);
NSLog(@"%lu",sizeof(&object));
NSLog(@"%lu",sizeof(a));
- 堆(heap):alloc出来的变量存放在堆区。
NSLog(@"************堆区************");
// 堆区
NSObject *object1 = [NSObject new];
NSObject *object2 = [NSObject new];
NSObject *object3 = [NSObject new];
NSObject *object4 = [NSObject new];
NSObject *object5 = [NSObject new];
NSObject *object6 = [NSObject new];
NSObject *object7 = [NSObject new];
NSObject *object8 = [NSObject new];
NSObject *object9 = [NSObject new];
NSLog(@"object1 = %@",object1);
NSLog(@"object2 = %@",object2);
NSLog(@"object3 = %@",object3);
NSLog(@"object4 = %@",object4);
NSLog(@"object5 = %@",object5);
NSLog(@"object6 = %@",object6);
NSLog(@"object7 = %@",object7);
NSLog(@"object8 = %@",object8);
NSLog(@"object9 = %@",object9);
- 未初始化数据(.bss):全局变量,并且未初始化
int clA;
static int bssA;
static NSString *bssStr1;
- 已初始化数据(.data):全局变量,并且初始化
int clB = 10;
static int bssB = 10;
static NSString *bssStr2 = @"hello";
- 代码段(.text):编写的代码在内存中的存储位置。
注意:静态区是以文件区分的。也就是说在一个h文件中定义一个全局变量a=10,在m文件中进行++修改,a=11,在外部(其他文件)进行调用对a进行++,还是从10开始累加。
例如:
vc的h文件中新建静态变量a=10
#import <UIKit/UIKit.h>
static int a = 10;
@interface ViewController : UIViewController
@end
vc的m文件中的viewDidLoad里对a++
- (void)viewDidLoad {
[super viewDidLoad];
NSLog(@"begin---%s:a=%d", __func__, a);
a++;
NSLog(@"end---%s:a=%d", __func__, a);
}
在AppDelegate的启动方法中加入一样的代码
@implementation AppDelegate
- (BOOL)application:(UIApplication *)application didFinishLaunchingWithOptions:(NSDictionary *)launchOptions {
NSLog(@"begin---%s:a=%d", __func__, a);
a++;
NSLog(@"end---%s:a=%d", __func__, a);
return YES;
}
看看打印结果:
从结果可以看出来a都是从10到11的变化。所以此处需要注意静态全局变量是针对文件处理的。
2、栈相关概念
栈是先进后出的一种数据结构。本文不对数据结构进行讲解,主要研究目标是内存栈区的中的一些概念。
压栈
函数实现的代码中,函数的参数、临时变量以及调用其他函数和其他函数的返回值等等信息,都需要进行压栈。目的是记录一些调用逻辑和顺序。比如函数A的实现中,调用了函数B,此时函数A的相关信息压入栈中。当函数B执行完,操作系统通过栈中记录的信息,知道要回到函数A中。这也就利用了栈的先进后出的特性。
栈帧
内存中栈区是从高地址连续延伸到低地址。每个函数的调用都有它自己独立栈区域,里面记录一些需要的信息,这个区域我们叫做栈帧。寄存器ebp
指向当前栈帧的底部(高地址),寄存器esp
指向当前栈的顶部(低地址)
如果函数A中调用了函数B,用一个伪代码来说明一下代码逻辑:
void 函数A(){
int a = 10;
函数B();
后续代码code;
}
void 函数B(){
......
return ...;
}
- 函数A中定义了一个临时变量a,调用函数B,以及后续代码code。栈区变化如图:
- 入栈变量a,正常入栈
- 然后是到
函数B
这行代码,函数调用底层就是要进行跳转,所以要先记录回来后的继续调用后续代码code的位置(入栈code的地址),然后记录函数A栈帧底部位置ebp。 - 入栈函数B相关的信息,调整寄存器ebp的位置,此时ebp指向的是函数B的栈帧底部。此处应该可以理解
栈帧是函数的独立的内存区域
。 - 栈的空间是连续的,所以栈顶是每个栈帧共用的。不用调整esp位置。
栈溢出
栈空间是系统分配的,里面的元素是系统进行自动清理。但是如果需要的栈大小超过了系统分配的,就会出现栈区不够用的情况,也就是所谓的栈溢出。
比如一个递归
函数,就会不断调用函数的入栈,如果层级过多超过了系统过的栈空间,就发生栈溢出。
利用堆栈溢出攻击计算机的最典型的例子是1988年利用fingerd漏洞进行攻击的蠕虫病毒。利用修改栈中的返回后续代码code的地址,实现跳转到恶意代码中的方式实现攻击。
针对堆栈溢出可能造成的计算机安全问题,通常有以下这些防范措施:
(1) 如果出现栈溢出的情况,减少递归的使用,用循环代替。
(2) 通过操作系统使得缓冲区不可执行,从而阻止攻击者植入攻击代码。但由于攻击者并不一定要通过植入代码来实现攻击,同时linux在信号传递和GCC的在线重用都使用了可执行堆栈的属性,因此该方法依然有一定弱点。
(3) 利用编译器的边界检查来实现缓冲区的保护。该方法使得缓冲区溢出不可能出现,完全消除了缓冲区溢出的威胁,但代价较大,如性能速度变慢。
(4) 程序指针完整性检查,该方法能阻止绝大多数缓冲区溢出攻击。该方法就是说在程序使用指针之前,检查指针的内容是否发生了变化。