在C语言柔性数组一文中,提到了内存对齐,于是想写篇文章总结总结内存对齐。
内存对齐
#include<stdio.h>
typedef struct line {
int len;
char *contents;
} line;
int main(int argc, char **argv)
{
printf("%d\n", sizeof(line));
}
/* 输出: 16
* 平台: Linux x64;
*/
为什么需要内存对齐
计算机系统对基本数据类型的合法地址做出了一些限制,要求某种类型对象的地址必须是某个值K(通常是2, 4或8)的倍数,这种对齐限制简化了处理器和存储器系统之间接口的硬件设计。
假设一个CPU总是从存储器中一次读出8个字节的块(块大小一般称之为为memory access granularity(粒度)),则地址必须为8的倍数,如果我们能保证多有的double类型地址对齐为8的倍数,那么我们只需要访问一次存储器就能取得我们想要的数据,否则,我们可能需要访问存储器2次,因为对象可能放在了2个8字节的存储器块中。
内存对齐规则
Linux 沿用的对齐策略是,2字节数据类型(short)的地址必须是2的倍数,而较大的数据类型(例如int,int*,float,double)的地址必须是4的倍数。而Windows对齐要求更严格,它要求double,long long类型数据应该是8的倍数。
struct s1 {
int i;
char c;
int j;
};
假设编译器最小9字节分配如图:
它不可能满足i和j(偏移为5)的4字节对齐要求。所以编译器要在c和j之间插入一个3字节的间隙,如图所示:
另外编译器结构的末尾也可能需要填充:
struct s2 {
int i;
int j;
char c;
};
如果我们将这个结构分配为9字节,只要保证结构体的起始地址满足4字节对齐要求,我们仍然可以满足字段i和j的对齐要求。但考虑如下:
struct s2 arr[4];
如果每个结构体分配9字节,不可能满足arr的每个元素的对齐要求。例如i,则地址分别为arr,arr+9,arr+18,arr+27。所以编译器会为结构体s2分配12个字节。如图:
练习
struct p1 { int i; char c; int j; char d; };
struct p2 { };
struct p3 { };
struct p4 { };
struct p5 { };