原文:【Golang】这个内存对齐呀!?_哔哩哔哩_bilibili
cpu要想从内存读取数据,需要通过地址总线把地址传输给内存。内存准备好数据输出到数据总线,交给cpu。如果地址总线只有8根。那这个地址就只有8位,可以表示256个地址,因为表示不了更多的地址,就用不到更大的内存。所以256就是8根地址总线最大的选址空间。要使用更大的内存,就要有更宽的地址总线。例如,32位地址总线就可以选址4G内存。每次操作一字节太慢,那就加宽数据总线。要想每次操作4字节,就要至少32根数据总线,8字节就要64位,这里每次操作的字节数。就是所谓的机器字长。
如果内存就像我们逻辑上认为的那样,一个挨一个,形成这样一个大矩阵。我们可以访问任意地址并把它输出到总线
但是实际上,为了实现更高的访问效率,典型的内存布局是这样的。
一个内存条的一面是一个Rank,红色圈中是一个Chip,而一个chip包括8个Banks。到bank这里,就可以通过选择行,选择列来定位一个地址了。
这不像是我们逻辑上认为的那样连续的存在,他们共用同一个地址。各自选择同一个位置的一个字节,再组合起来,作为我们逻辑上认为的连续8个字节。通过这样的并行操作提高了内存访问效率,但如果使用这种设计,这里的地址就只能是8的倍数。如果非要错开一个格,由于最后一个字节对应的位置与前七个不同。不能在一次操作中被同一个地址选中,所以这样的地址是不能用的。
之所以有些cpu能够支持访问任意地址。是因为他多做了许多处理,例如,你想从地址1开始读8字节的数据,cpu会分两次读。第一次从0-7。但只取后7字节,第二次从8-15。但只取第1字节,把两次结果拼接起来,拿到所需数据,
但是这必然会影响性能。所以,为保证程序顺利高效的运行,编译器会把各种类型的数据安排到合适的地址,并占用合适的长度。这就是内存对齐。每种类型的对齐值都要是它的对其边界。内存对齐要求数据存储地址以及占用的字节数都要使它对其边界的倍数。所以这个int32要错开2字节,从4开始,却不能紧接着从2开始。
现在的问题是怎么确定每种类型的对其边界呢?
这和平台有关,go语言支持这些平台。可以看到,常见的32位平台指针宽度和寄存器宽度都是4字节,64位平台上都是8字节。而被go语言称为寄存器宽度的这个值就可以理解为机器字长,也是平台对应的最大对齐边界。
而数据类型的对齐边界是取类型大小与平台最大对齐边界中较小的那个。不过要注意,同一个类型在不同平台上大小可能不同,对其边界也可能不同。
为什么不统一使用平台最大对齐边界,或者统一按各类型大小来对齐呢?我们来试一下。假设目前是64位平台,最大对齐边界为8字节,int8只有一个字节。
按照1字节对齐的话,它可以放在任何位置,因为总能通过一次读取把它完整拿出来。如果统一对齐到8字节,虽然同样只要读取一次,但每个int8类型的变量都要浪费7字节,所以对齐到1。int16占两字节,按照2字节对齐,可以从这些地址开始存,而且能保证只用读取一次。
如果按照一次节对齐就可能存成这样,
那就要读取两次,再截取拼接会影响性。如果对齐到8字节,与int8类型一样会浪费内存,所以对齐到2。
这是小于最大对齐边界的情况。再来看看大于的情况,假设要在32位平台存储一个int64类型的数据,在这2字节被占用的情况下。如果对齐到类型大小8就要从这里开始存,
如果对齐到4,就可以从这里开始,
内存浪费更少,应该选择它。所以类型对齐边界会这样选择依然是为了减少浪费,提高性能。
最后来看看怎么确定一个结构体的对其边界。
对结构体而言,首先要确定每个成员的对齐边界,然后取其中最大的,这就是这个结构体类型的对齐边界。然后我们来存储这个结构体变量,看看它怎么对齐。内存对其第一个要求存储这个结构体的起始地址是对其边界的倍数。假设从这里开始存。
结构体的每个成员在存储时都要把这个起始地址当作地址0,然后再用相对地址来决定自己该放在哪。来看第一个成员a,他要对齐到1字节,而这里是相对地址0所以直接放这,然后是第二个成员b。
他要对齐到8字节,但是接下来的地址对8取模并不等于0,所以要往后挪,挪到这。
接下来是c,他要对其到4字节,这里就行。
最后是d对齐到2字节,所以直接放。
所有成员都放好,还不算完,别忘了内存对其的第二个要求。结构体整体占用字节需要是类型对齐边界的倍数,不够的话要往后扩张一下,所以它要扩充到相对地址23这里。最终,这个结构题类型的大小就是24字,ok,对齐完成。
至于为什么要限制类型大小等于其对齐边界的整数倍,我们可以这样理解。如果这里不扩到对齐边界的整数倍,这个结构体类型大小就是22字节。那么,要使用一个长度为2的t类型的数组,按照元素类型大小,会占用44字节的,
内存第一个元素在这。第二个元素在这。问题出现了,第二个元素并没有内存对齐。所以只有每个结构体的大小都是对齐值的整数倍,才能保证数组中每一个都是内存对齐的。