想要理解C++结构体,要从两个角度出发。 一是内存角度,而是面向对象角度。
为什么要内存对齐
内存对齐本来是个很简单的事,但是网上始终没有一个很好的解释。 有些人强调背公式,有些人强调记规则。但我认为这些都不必要。
先来看看数据是怎样从DRAM中读出的。
在这幅图上,最重要的信息是 主存储器地址A处的64-bit数据。这说明,当CPU给出一个地址时,存储器会同时读出64-bit数据, 也就是8 byte。 当CPU想拿到内存条里的某个变量时,无论这个变量是 4 byte 的 int 型变量,还是 1 byte 的 char 型变量, 内存条都会提供给 CPU 8 byte 的数据。
那么问题来了。假设有一个 double
类型的变量,它占用了 8 byte。 但它在存储器中的布局是下面这样的。当CPU需要读取这个变量时,存储器不得不传输两次,而且每次都包含 4 byte 的垃圾数据。这会导致访存性能下降。
为了避免这种情况,需要让每个变量的首地址都是 8 的倍数。这也就是所谓的 按 8 字节对齐。
速算结构体尺寸
面试 C++ 岗时,计算结构体占用的空间是必考题。 这里我献出一个速算技巧。 比如有一个结构体A
,请你计算sizeof(A);
的结果。
struct A
{
char a;
double b;
char c;
};
首先,你要找出占用空间最大的成员变量,比如 struct A
中, double b
占用空间最大,共占 8 byte。那么这个结构体就要按 8 byte 对齐。
然后,请你试想一个 8 byte 大的箱子。你要把所有成员变量逐个放进去。先放入 char a
,再放入double b
。
放入 char a
后,当前行已经没有空间再容纳 double b
了, 这时,剩余的空间(蓝色所代表的)就是 memory padding,也就是编译器为你填充的额外空间。 double b
会放在另一个8 byte 的箱子里。
最后,放入 char c。这没什么好说的, 8 byte 的箱子里只有它一个变量。
所以,struct A
最后所占用的空间,是 24 byte。而且,struct A
的内存布局,是非常规整的,每个成员变量的首地址,都是 8 的倍数。 这样,存储器只需传送3次,就可以让CPU拿到struct A
的全部数据。
如何按指定字节对齐
虽然struct A
的已经完美对齐,但是 memory padding 有点大,会造成空间浪费。如果把箱子的尺寸从 8 byte 改为 4 byte,好像一样可以对齐,只不过 double b
会被切割。
如何控制箱子的大小呢?如果你用 Visual Studio 写 C++ 代码,可以使用编译器控制指令#pragma pack
实现。
#pragma pack(4)
struct A
{
char a;
double b;
char c;
};
此时,执行 sizeof(A)
,结果是 16,这正好符合我们用速算法得到的结果。
Property Offset
property 是结构体中数据成员的别名。比如 struct A
中, char a
是 property, double b
也是 property。 在 C/C++ 中,通过某种手段,可以取得 property 相对于结构体基地址的偏移,你可以简单理解为“唯一的代号”。 我们来看下面一段代码:
size_t offset = (size_t) & (((A*)0)->c);
这个表达式的意思是,把数字0转换成结构体指针后,先拿到它的某个成员,再把这个成员地址转换成数字。通过这个表达式,可以取得某个 property 相对于结构体基地址的偏移量。 它也算是一种“地址”,不过是相对的。
有了 property offset后,只要提供一个结构体基地址,就可以用取得 property。
double value = *(double*)((size_t)&a + offset);
其中, (size_t)&a
将结构体基地址转化为一个数字,(size_t)&a + offset
把基地址和偏移加在一起,形成 property最终的地址。最后,把最终地址转化为指针,再取值,就可以拿到property的值。
所以,对于任何类对象,只要你能提供对象地址和property的偏移,就可以访问。其中,对象地址在运行期确定,property offset 在 编译期确定。