我们都知道,函数的局部变量只能在声明它的函数中访问,超出作用域后的非法访问会得到不可预测的值,甚至导致程序崩溃。
这么说来返回值岂不是都要用全局变量?既然都使用了全局变量,那还有返回的必要吗?那么函数的返回值岂不是没有存在的意义了?
上一篇中,我们了解了函数调用栈,趁热打铁,这次我们就刚好利用学到的知识来解决眼前的问题。
测试用例
char* get_memory() {
char p[] = "hello world";
return p;
}
int main(int argc, const char * argv[]) {
char* str = NULL;
str = get_memory();
printf("%s",str);
return 0;
}
问题1. char p[]
真的是出了函数范围就访问不到正确内容了吗?
进入反汇编调试界面,断点在 get_memory
函数调用前:
a. -18(%rbp) 是局部变量 char* str,用来存放 get_memory 函数的返回值;
b. -18(%rbp) 的值在 printf 函数调用时,作为第二个参数;
进入 get_memory
函数:
c. get_memory 函数返回指针指向栈中内存地址 0x00007fff5fbff69c(-0x14(%rbp));
d. 第 9 到 12 行指令是将 "hello world" 这个字符串中的每个字符拷贝到 0x00007fff5fbff69c(-0x14(%rbp) 开始的连续地址中;
调用 printf
函数之前:
可以看到,虽然已经结束了 get_memory
函数的调用,但是栈中分配给局部变量 char p[]
的内存地址,并没有被释放或者覆盖,此刻依然还是可以访问到正确的内容;
但是在函数调用栈里,我们说过,栈是由编译器自动分配和释放,是不可控的,这里只是为了理解过程。
问题2. str
为什么不能被 printf
正确打印?
通过 问题1. 我们分析得知,get_memory
中的局部变量 char p[]
在未调用 printf
函数之前,是可以正确访问的。
那么无法正确打印的问题,很明显就出在 printf
函数本身。
调试框输入 b printf
命令,可以在 printf
函数内部打上断点。
printf
在更新了 rbp
之后,直接 push
了三个空内容寄存器,将 get_memory
函数中分配给 char p[]
的内存覆盖。
通过简单的栈图,更直观的感受一下:
此刻的内存情况:
如何正确返回局部变量?
我们在分析 问题1.
的时候,从 get_memory
函数的反汇编代码可以清楚的看到,局部变量 char p[]
实际上是在栈上分配了一段连续内存,再将 "hello world" 中的字符拷贝到其中,然后返回首地址;而栈是由编译器自动分配和释放的,是不可控的,那么返回的地址中的内容,当然也就是不可控的,这显然不是我们的初衷,所以 函数不能返回指向栈内存的指针。
正确的返回姿势:
- 声明为
static
后,变量将存储在静态存储区,分配一次后不会销毁,直到程序结束都有效,不再受函数作用域限制。 -
malloc
在堆上分配内存,返回指向堆内存的指针,需要手动释放内存,防止内存泄漏。 -
char *p = "hello world"
字符串分配在常量区,返回指向常量区的指针。
对于基本数据类型,编译器会直接进行值拷贝。