结构体是C/C++两种语言中的基础语法, C语言中的结构体只是一个存粹的数据集合类型的描述,它只有数据成员而没有成员方法。C++中的结构体则被赋予为一个类定义的角色,它可以有数据成员也可以有成员方法。OC语言源自于C语言,它是面向对象的C语言,所以OC结构体也只有成员变量。
结构体中的成员变量可以是基本类型,也可以是数组,也可以是指针,还可以是其他的结构体类型。
结构体尺寸
结构体的Size大小,也就是结构体实例占用的内存字节数。受操作系统字长、编译器、对齐方式等众多因素的影响。因此要确认一个结构体的尺寸时如果没有上述的约束前提则是没有统一结果的。一般情况下计算结构体尺寸大小有如下规则:
结构体成员内存对齐的规则
-
数据成员对齐规则
:struct
或者union
的数据成员,第一个数据成员放在offset为0的地方,以后每个数据成员存储的起始位置要从这个成员的大小或者成员的子成员大小(只要该成员有子成员,比如数据、结构体等)的整数倍开始,也就是结构体中每个数据成员的偏移位置是数据成员本身尺寸的倍数。(例如int在32位机中是4字节,则要从4的整数倍地址开始存储) -
结构体作为成员
:如果一个结构里有某些结构体成员,则其结构体成员要从其内部最大元素大小的整数倍地址开始存储,外部结构体的尺寸则是所有被嵌套中的结构体成员内部以及自身中的最大基础类型数据成员尺寸的倍数。(例如:struct a
里面存有struct b
,b
里面有char
、int
、double
等元素,则b
开始存储的位置应该从8
的整数倍的位置开始) -
最后的大小
:结构体的总大小,即sizeof
的结果,必须是其内部最大成员的整数倍,不足的要补齐
C和OC的基础数据类型字节大小
根据以上规则,定义一个结构体在64位系统下的内存分布:
struct Person {
bool sex;
short int age;
char *address;
float height;
char name[7];
};
从图中可以看出:
-
sex
数据成员是bool
型,它占用1个字节的内存,而且是结构体中的第一个数据成员,第一个数据成员的偏移位置总是从0开始(0是任何数据类型大小的倍数)。 -
age
数据成员是short int
,它占用2个字节的内存,它的起始位置原来应该是在编号1,但是1并不是2的倍数,所以向后偏移1个字节,到了编号2的位置,2是2的倍数。同时我们看到在第一个数据成员sex
和第二个数据成员age
之间留下了一个字节的空隙,padding。 -
address
数据成员是void *
, 它占用8个字节的内存,它的起始位置原来应该是在编号4,但是4并不是8的倍数,所以向后偏移4个字节,到了编号8的位置,8是8的倍数。这个数据成员为了对齐留出了4个字节的空隙。 -
height
数据类型是float
, 它占用4个字节的内存,它的起始位置是16,而16是4的倍数,不需要偏移。所以这个成员没有留下padding。 -
name
数据成员是char[7]
,它占用7个字节,它的偏移位置是20,而20是1的倍数,不用偏移。它也没有留下padding。 - 整个结构体中最大数据成员类型是
char *
,它占用8个字节的内存,因此结构体的尺寸是8的倍数,而由图可以看出整个结构体实际占用了27个字节,所以要对齐到8的倍数,也就是32个字节。所以在尾部留下了5个字节的padding。
从上面案例可以看出因为需要对齐内存,结构体中的数据成员并不一定是连续保存的,而是有可能会存在一些padding空隙。 这也引出了另外一个问题:
当我们在定义结构体时如果结构体成员的定义顺序安排的不合理就有可能会导致多余内存空间的占用和浪费。 为了达到最佳内存空间占用,可以将上述结构体中数据成员的定义顺序进行调整如下:
struct Person {
bool sex;
char name[7];
float height;
short int age;
char *address;
};
通过下图可以看到优化后内存空间分布
对比可以发现内存在成员间没有间隙,而相比之前足足省了8个字节的空间。
那么与结构体类似的OC类中属性的定义顺序会导致内存占用的不同吗?下面我们来看看这个问题。
类属性内存分布
要知道类和结构体一样都是一些数据集合的声明描述,它们都包含有成员变量。而类比结构体多了方法的定义。但是方法本身不会占用对象存储空间。
定义一个类:
@interface BKPerson : NSObject
@property (nonatomic, copy) NSString *nick;
@property (nonatomic, assign) long height;
@property (nonatomic, copy) NSString *name;
@property (nonatomic, assign) int age;
@end
我们在OC类中声明的属性最终会转化为结构体的数据成员。每个OC类中还会有一个隐式的数据成员isa
(struct NSObject_IMPL NSObject_IVARS;
),这是一个指针类型的数据成员,在申请类对象内存之后进行对象和类的关联时第一个被定义的数据成员就是这个isa
指针。
这个类转化为结构体是这样的:
struct BKPerson_IMPL {
struct NSObject_IMPL NSObject_IVARS;
int _age;
NSString *_nick;
long _height;
NSString *_ name;
};
从上面的定义中可以看出,除了会多出一个isa
数据成员外,数据成员的顺序也发生了变化,它不再是按OC中定义的属性顺序进行排列了,编译器会自动优化OC类中属性的排列顺序。
猜想:OC类中定义的属性顺序会在编译时进行优化调整,一般的都是按数据类型的尺寸从小到大进行排列,相同尺寸的数据成员则按属性定义的顺序进行排列。
下面我们验证下这个猜想。
- 先看看内存的分配
当我们注释了两个属性name
和age
的赋值操作后,打印内存可以看到系统开辟对象的内存时就已经把age和name的空间预留下来,而不是在赋值属性的时候才开辟的内存。
- 我们把上面注释的两个属性打开,通过打印可以看到内存中属性的分布如下:
紧跟在isa
指针之后的,依次是age
、nick
、height
、name
。
总结:当为一个类实例开辟内存空间时,系统会帮我们优化排序,以减少不必要的内存浪费,属性在内存的排序规则按照属性的类型占用空间的大小,从小到大排序,相同大小的则按照我们属性的定义顺序来排序。所以我们在定义类的属性时可以不用关心定义顺序。
类的内部成员变量的内存分布
但是我们经常在.m
文件类的实现中定义内部成员变量,例如在BKPerson
类定义两个内部成员变量:
@implementation BKPerson
{
short int weight;
NSString *skinColor;
}
- (instancetype)init{
if (self = [super init]) {
skinColor = @"黄色";
weight = 60;
}
return self;
}
这时候转化成结构体是这样的:
struct BKPerson_IMPL {
struct NSObject_IMPL NSObject_IVARS;
short int _weight;
NSString *_skinColor;
int _age;
NSString *_nick;
long _height;
NSString *_ name;
};
查看内存空间的变化,分别打印这两个成员变量:
可以看到,在
isa
指针(struct NSObject_IMPL NSObject_IVARS;
)之后紧跟着的是刚定义的内部成员weight
,再往后偏移8个字节的是内部成员skinColor
,之后才是之前定义的属性成员。而可以看到系统为这个实例对象所有的数据成员开辟了8*8=64
个字节的大小。
如果我们把weight
和skinColor
位置调整下
@implementation BKPerson
{
NSString *skinColor;
short int weight;
}
- (instancetype)init{
if (self = [super init]) {
skinColor = @"黄色";
weight = 60;
}
return self;
}
再查看内存,可以发现内部数据成员的顺序也改变了,isa
之后第一个存放的是skinColor
,第二个的8个字节,先后存了short int weight
和属性成员int age
。这时系统为这个实例对象所有的数据成员开辟了6*8=48
个字节的大小。比刚才减少了64-48=16
个字节。
可以得出结论:
类的实例对象的内部成员变量的内存排列顺序是根据定义成员变量的顺序,系统不会做优化,内部成员变量在内存中的存放位置是在属性成员的前面。所以特别注意如果我们用到了多个内部成员变量,需要自己优化定义的顺序,节省空间,最好都使用属性,这样系统会自动帮我们优化内存排序。
最后,OC类实例对象的内存大小:
OC中类实例对象的占用内存大小也是所有成员变量的总和,并且在64
位系统下是8
的倍数(64位系统下指针占用8位),32
位系统下是4
的倍数(32位系统下指针占用4位),不足则补齐。而实际向系统申请的内存空间是16
的倍数,按照16
字节对齐。