一、值拷贝和引用拷贝
先引入c++中的两个概念,值拷贝和引用拷贝。
1、两者区别
值拷贝,拷贝的是存储在stack上的数据。如以下代码,发生的就是值拷贝:
引用拷贝,拷贝的是存储在heap上的数据的所在地址,该地址存储在stack中。如拷贝String,就发生了引用拷贝:
2、引用拷贝容易引发的问题
引用拷贝的原理如下:
问题一:悬垂指针
经过引用拷贝之后,指针s2和指针s1指向了同一块地址。试想一下这样的情景:当s1指向的堆内存被释放了之后,如c语言中执行了free(s1)语句,那么s2指针若在其后被使用,就会导致内存访问的错误,造成严重的后果。这个情境中,s2指针就被成为悬垂指针(Dangling Pointer)。
悬垂指针:指针所指向的对象已经被释放或者回收了,但是指向该对象的指针没有作任何的修改,仍旧指向已经回收的内存地址。 此类指针称为垂悬指针。
问题二:二次释放
当变量离开作用域后,Rust 自动调用 drop 函数并清理变量的堆内存。试想一下这样的情景:当 s2 和 s1 离开作用域,他们都会尝试释放相同的内存,两次释放(相同)内存会导致内存污染,它可能会导致潜在的安全漏洞。这种错误叫做二次释放(double free)。
二、所有权机制
1、基本内容
针对以上可能存在的问题,为了能保证内存安全,rust设计了所有权机制:当做了"let s2=s1"这种引用拷贝之后,rust就认为原来指向那块内存的指针s1失效。若在s2创建之后再去使用s1,就会发生报错。内存示意图如下:
其实在rust中,用“引用拷贝”是不贴切的。图中的s1和s2,与其说是拷贝,不如说是移动。rust中有两种语义:复制(copy)和移动(move),Copy就对应了值的拷贝,即在栈中复制一份副本,然后绑定在新的变量上;Move就表示引用/指针发生了移动,原有的指针失效,只有新的指针有效。
由此,rust的所有权机制(OwnerShip)就被揭开:
rust中分配的每一块内存都有且仅有唯一的所有者,由所有者来负责该内存的释放和读写权限。
2、所有权与函数
向函数中传递参数时,可能会发生Copy或者Move,就跟赋值语句一样。
示例如下:
其中有指向堆内存的指针s字符串,有栈值x。当s进入函数中时发生了Move行为,堆内存的所有权移交给了函数,原有的所有权占有者s失效;而x进入函数时发生的是Copy行为,进入函数的只是原来x值的一个副本。
3、引用
(1)引用的基本概念
有一个问题如下:
写一个函数,传入一个字符串,要求返回字符串的内容和长度。
考虑到rust的所有权机制,我们会写成下面的样子:
这个例子中,我们必须要新引入一个变量s2用于接收s1传进函数中丢失的所有权。这样一来就显得代码臃肿。由此引出rust在设计上的另一个特性:引用(reference)。
引用的底层原理如下:
&s1 语法让我们创建一个 指向 值 s1 的引用,但是并不拥有它。即引用是不持有所有权的。因为并不拥有这个值,当引用离开作用域时其指向的值也不会被丢弃。
(2)可变引用和不可变引用
有示例如下:
change函数尝试在s之后加上新的字符串内容,这里运行会出错,因为s是不可变的。
只需要在源代码上稍作修改,就可以正常运行:
这里s用到了mut,函数形参和实参都用到了&mut,这就是可变引用的实例。
但是值得注意的是:
在特定作用域中的特定数据有且只有一个可变引用。
如以下代码,是没办法通过编译的:
这可以非常有效地避免数据竞争。但如果是多个不可变的引用,则是可以正常编译运行的,因为都是不可变的,对内存安全没有影响。同时有可变和不可变的引用,也是不被允许的。