C语言没有STL,缺乏对动态长度字符串功能的支持;同时,C使用'\0'判断字符串的结尾,不具有二进制安全性。然而在程序开发时,我们可以通过自定义的方式,实现简易的动态长度字符串功能。
动态长度字符串结构定义如下:
struct DynamicBuffer
{
unsigned len; // 实际长度
unsigned free; // 剩余可用空间大小
char data[0]; // 实际内容
};
其中,较为少见的是DynamicBuffer结构中的最后一项——定义了长度为0的字符数组。零长数组是在GNU C中定义的一项功能:
Zero-length arrays are allowed in GNU C. They are very useful as the last element of a structure which is really a header for a variable-length object.
在其他环境中编译含有零长数组的代码可能会导致编译错误。
在DynamicBuffer的定义中,我们当然也可以用char*来保存字符串数据。但是,使用零长数组代替数组指针具有以下优势:
- 指针占用存储空间;而零长数组则不占用结构体空间。
- 使用指针需要初始化,使用时需要间接寻址;零长数组不需要初始化,内存地址和后面的元素地址相同,数组名可以直接当作指针使用。
程序测试用例如下:
#include <stdio.h>
#include <stdlib.h>
#define LENGTH 5
struct DynamicBuffer1
{
unsigned len;
unsigned free;
char *data;
}__attribute((packed));
struct DynamicBuffer2
{
unsigned len;
unsigned free;
char data[0];
}__attribute((packed));
int main()
{
struct DynamicBuffer1 *b1;
struct DynamicBuffer2 *b2;
int i;
printf("DynamicBuffer1 length: %d\n",sizeof(struct DynamicBuffer1));
printf("DynamicBuffer2 length: %d\n",sizeof(struct DynamicBuffer2));
b1=(struct DynamicBuffer1*)malloc(sizeof(struct DynamicBuffer1));
b1->len=0;
b1->free=LENGTH;
b1->data=(char *)malloc(sizeof(char)*LENGTH + 1);
b1->data[0] = 100;
b1->free--;
b1->len++;
printf("\nb1->len=%d,b1->free=%d,*(b1->data)=%d\n",b1->len,b1->free,*b1->data);
printf("b1\t\t address: %p\n", b1);
printf("b1->len\t address: %p\n", &(b1->len));
printf("b1->free\t address: %p\n", &(b1->free));
printf("b1->data\t address: %p\n", b1->data);
b2=(struct DynamicBuffer2*)malloc(sizeof(struct DynamicBuffer2)+sizeof(char)*LENGTH + 1);
b2->len=0;
b2->free=LENGTH;
for(i=0;i<LENGTH;i++)
{
b2->data[i]=i;
b2->free--;
b2->len++;
}
printf("\nb2->len=%d,b2->free=%d\n",b2->len,b2->free);
printf("b2\t\taddress: %p\n", b2);
printf("b2->len\taddress: %p\n", &(b2->len));
printf("b2->free\taddress: %p\n", &(b2->free));
printf("b2->data\taddress: %p\n", b2->data);
free(b1->data);
free(b1);
free(b2);
}
用例输出:
DynamicBuffer1 length: 16
DynamicBuffer2 length: 8
b1->len=1,b1->free=4,*(b1->data)=100
b1 address: 0x1ae7010
b1->len address: 0x1ae7010
b1->free address: 0x1ae7014
b1->data address: 0x1ae7030
b2->len=5,b2->free=0
b2 address: 0x1ae7050
b2->len address: 0x1ae7050
b2->free address: 0x1ae7054
b2->data address: 0x1ae7058
可见,通过零长数组定义的DynamicBuffer2占用的内存空间只有8个字节(两个整形变量的空间),且data数组地址紧邻DynamicBuffer2的内存地址。Redis的SDS API也使用了类似的方式,提供了二进制安全的动态长度字符串功能。