敞开成长之旅!这是我参加「日新计划 2 月更文应战」的第 29天,点击检查活动概况

前语

结构体的定义,大家都很熟悉,但想要定义出更节约内存空间的结构体,可不是一件简略的事。

咱们有必要把握了Go的结构体内存对齐机制,才干做出相应的优化(节约内存并提高性能)。

先来看个例子

下面定义两个结构体,字段都一样,仅仅部分字段稍微调整了一下次序。

但输出的成果,为什么bad占用24字节,而good却只占用16字节呢?一个次序调整就节约了8个字节,太奇特了

type BadSt struct {
  A int32
  B int64
  C bool
}
type GoodSt struct {
  A int32
  C bool
  B int64
}
func main() {
  bad := BadSt{A: 10, B: 20, C: false}
  fmt.Println(unsafe.Sizeof(bad))
  good := GoodSt{A: 10, B: 20, C: false}
  fmt.Println(unsafe.Sizeof(good))
}
//输出成果:
//24
//16

想要解开这个问题,咱们得先来学习一下内存对齐机制,然后再来进一步分析

内存对齐机制

  • 基本概念

为了能让CPU能够更快的存储与读取到各个字段,Go编译器会帮咱们把结构体做数据的对齐。所谓的数据对齐,是指内存地址是所存储数据大小的整数倍(按字节为单位),以便CPU能够一次将该数据从内存中读取出来,减少了读取次数。编译器通过在结构体的各个字段之间填充一些空白已到达对齐的意图

  • CPU拜访内存

CPU 拜访内存时,并不是逐个字节拜访,而是以机器字(word)为单位进行拜访。比如 64位CPU的字长(word size)为8bytes,那么CPU拜访内存的单位也是8字节,每次加载的内存数据也是固定的若干字长,如8words(64bytes)、16words(128bytes)等

  • 对齐系数

不同硬件平台占用的大小和对齐值都可能是不一样的,每个特定平台上的编译器都有自己的默许”对齐系数”,32位系统对齐系数是4,64位系统对齐系数是8

不同类型的对齐系数也可能不一样,运用Go语言中的unsafe.Alignof函数能够回来相应类型的对齐系数,对齐系数都符合2^n这个规律,最大也不会超过8

func main() {
  fmt.Printf("bool:   %d\n", unsafe.Alignof(bool(true)))
  fmt.Printf("string: %d\n", unsafe.Alignof(string("a")))
  fmt.Printf("int:    %d\n", unsafe.Alignof(int(0)))
  fmt.Printf("int32:  %d\n", unsafe.Alignof(int32(0)))
  fmt.Printf("int64:  %d\n", unsafe.Alignof(int64(0)))
  fmt.Printf("float64:  %d\n", unsafe.Alignof(float64(0)))
  fmt.Printf("float32:%d\n", unsafe.Alignof(float32(0)))
}
//输出成果:
//bool:   1
//string: 8
//int:    8
//int32:  4
//int64:  8
//float64:8
//float32:4
  • 对齐准则
  1. 结构体变量中成员的偏移量有必要是成员大小的整数倍
  2. 整个结构体的内存大小有必要是最大字节的整数倍(结构体的内存占用是1/4/8/16byte…)

事例进一步分析

  • BadSt结构体,占用24个字节

Go struct优化原来如此简单高效,妙啊

type BadSt struct {
  A int32
  B int64
  C bool
}

分析过程:

  1. 字段A 4字节:先核算偏移量,最开头下标为0,0%4=0,正好整除,先占用4个字节;
  2. 字段B 8字节:下标4-7,对8都不能整除,则填充空白,下标8能够整除,所以下标8-15 8个字节为字段B的存储运用;
  3. 字段C 1字节:下标16,对1能够整除,所以下标16则用作字段C的存储;
  4. 最终,该结构体字段最大字节为8且现在已占用17字节,要保证是整数倍,所以最终面需求填充7个字节,占满24字节,才干满足条件(对齐准则2)。

  • GoodSt结构体,占用16个字节

Go struct优化原来如此简单高效,妙啊

type GoodSt struct {
  A int32
  C bool
  B int64
}

分析过程:

  1. 字段A 4字节:先核算偏移量,最开头下标为0,0%4=0,正好整除,先占用4个字节;
  2. 字段C 1字节:下标4,对1能够整除,所以下标4则用作字段C的存储;
  3. 字段B 8字节:下标5-7,对8都不能整除,则填充空白,下标8能够整除,所以下标8-15 8个字节为字段B的存储运用;
  4. 最终,该结构体字段最大字节为8且现在已占用16字节,正好是整数倍,所以后面不再需求填充空白了。

总结

把握了内存对齐机制后,结构体struct的优化,是不是也会觉得原来如此简略高效呀,调整下字段次序,效果马到成功(简略理解,就是将对齐系数小的字段,尽可能的放在一同)。

内存对齐其实就是典型的空间换时刻的方式,来到达优化的意图。牢记对齐准则,对实践场景进行分析,全部都会很变得明晰明晰

假如本文对你有协助,欢迎点赞收藏加重视,假如本文有过错的当地,欢迎指出!