右值引用是C++11
中一个非常重要的特性。
右值引用的提出,是为了在语法层面,解决向C++中添加移动语义时难以解决的问题,而必须扩展语法,而不是扩展标准库。
一、什么是右值引用
1. 什么是左值右值?
左值和右值是从C语言继承而来的名词,这个概念在C++中一直存在,只是大多时候被忽视了,原本是为了帮助记忆:左值可以位于赋值语句的左侧,而右值则不能。
然而在C++中,二者的区别就没有那么简单了,但是也可以总结出一个简单的特征:
左值具有持久的状态,而右值要么是字面常量,要么是在表达式求值过程中创建的临时对象。
也有一种快捷的分辨方式,左值可以取地址,右值不可以取地址。
int i = 42; // i是左值,字面常量42是右值
Object o;
Object p = 2 * o; // p是左值,
// 而2*o的计算结果会创建一个临时对象,是右值,再拷贝给p
2. 什么是右值引用?
对于在C++11之前的引用类型,可以称之为左值引用,即只能绑定至左值的引用。
那么右值引用就是绑定至右值的引用,通过类型&&
表示。虽然和左值引用类型符号相似,但却是完全不同的两个类型。
T&
可以绑定至左值,const T&
和&&
可以绑定至右值
int &lRef = 0; // 错误。 字面常量0是右值,左值引用lRef不能直接绑定至右值
int obj = 0;
int &lRef = obj; // 正确。
// 可以先使用字面常量0构造一个obj对象,对象可以作为左值。
// 然后将左值引用lRef绑定至对象obj
const int &lRef = 0; // 正确。 可以将const左值引用绑定至右值
int &&lRef = 0; // 正确。 可以将右值引用绑定至右值
P.S. 需要注意的是,虽然右值引用是绑定至右值,但是其本身是个左值。可以理解为,右值引用不是字面常量也不是临时变量,所以其为左值。
二、右值引用有什么用?
提升性能。
前面说到右值引用的提出,是为了在语法层面,解决向C++中添加移动语义时难以解决的问题
,那么为什么要添加移动语义,还要从深浅拷贝说起。
对于一个C++11之前的自定义类,拷贝构造函数中只能指定为深拷贝或者浅拷贝。
举个栗子:
#include <iostream>
#include <memory.h>
#define BUFF_LEN (128)
class Demo
{
public:
Demo()
{
printf("construct: %p\n", this);
m_p = (char *)malloc(BUFF_LEN);
}
Demo(const Demo &other)
{
printf("copy from %p to %p\n", &other, this);
// 深拷贝
m_p = (char *)malloc(BUFF_LEN);
memcpy(m_p, other.m_p, BUFF_LEN);
}
~Demo()
{
if (m_p) {
printf("destruct: %p\n", this);
free(m_p);
m_p = nullptr;
}
}
public:
char *m_p;
};
Demo func()
{
Demo a;
return a;
}
int main()
{
Demo b = func();
return 0;
}
自定义一个Demo
类,类内有个指针成员变量m_p
,在构造的时候申请内存,拷贝构造的时候执行深拷贝。
因此在main
中,将func
的返回值对象赋值给b
的时候,会调用拷贝构造函数执行拷贝。
通过g++ main.cpp -fno-elide-constructors
编译程序并执行,可以得到以下结果。(其中的-fno-elide-constructors
编译选项为指定编译器不对构造相关过程进行优化)
可以看到,执行了一次构造和两次拷贝构造,即一共发生了三次内存申请。但是其中有两次是函数返回时构造的临时对象,也执行了拷贝构造函数申请内存,这两次对于性能而言是浪费的,这就是在部分场景下拷贝构造的性能缺陷。
可见这类性能缺陷的根本原因是临时对象的拷贝构造,而临时对象生成的根因是C++的值语义,如果修改会导致一系列的连锁反应并很难向后兼容。所以,只能向临时对象的拷贝构造中寻找解决方案。
如果通过临时对象构造新对象时,可以直接把临时对象已申请的内存浅拷贝,然后临时对象析构时不释放该段内存,那么新对象不就无需重新申请内存,解决这类性能缺陷了吗。
这就是移动语义的含义,把一个对象(包括临时对象)内部的资源移动给另一个对象。
结合右值引用,给Demo
类添加一个构造函数。
#include <iostream>
#include <memory.h>
#define BUFF_LEN (128)
class Demo
{
public:
Demo()
{
printf("construct: %p\n", this);
m_p = (char *)malloc(BUFF_LEN);
}
// 拷贝构造
Demo(const Demo &other)
{
printf("copy from %p to %p\n", &other, this);
// 深拷贝
m_p = (char *)malloc(BUFF_LEN);
memcpy(m_p, other.m_p, BUFF_LEN);
}
// 移动构造
Demo(Demo &&other)
{
printf("move from %p to %p\n", &other, this);
// 浅拷贝
m_p = other.m_p;
other.m_p = nullptr;
}
~Demo()
{
if (m_p) {
printf("destruct: %p\n", this);
free(m_p);
m_p = nullptr;
}
}
public:
char *m_p;
};
Demo func()
{
Demo a;
return a;
}
int main()
{
Demo b = func();
return 0;
}
因为右值引用与左值引用是完全不同的类型,所以可以重载一个构造函数Demo::Demo(Demo &&other)
,也可以称为移动构造函数。
此时再重新编译并执行,打印结果如下。
可见,依旧是调用了三次构造函数,但是其中两次调用的是我们新加的移动构造,其内部并没有进行内存申请,而且被拷贝的临时对象在析构时也没有进行已申请内存的释放。由此上述的性能缺陷被解决了。
小结:
- 通过右值引用类型重载构造函数,对于由其他对象构造的新对象,可以根据拷贝源的属性不同(左值/右值),分别调用原本的拷贝构造,或者移动拷贝构造,执行不同的深/浅拷贝。
- C++11只是通过右值引用类型,提供了移动拷贝实现的机制,但是不会生成默认移动拷贝构造函数,需要开发者实现。
- 右值匹配的入参类型优先是
T&&
,然后才是const T&
。
三、右值引用还能怎么用?
1. 移动语义
上述使用移动构造的前提是,拷贝源为临时对象,即为右值时。
那么广义上来思考,如果在程序执行中,某个对象在某个时刻之后再也不会被使用了,那么是不是也可以从这个时刻起,将其视为临时对象呢?
于是标准库提供了移动函数std::move
,其内部会把传入的左值强转成右值再返回出来。于是原本的一个左值,可以由此传入移动构造函数。
举个栗子,依旧使用上面定义的Demo
类,只修改一下main
函数:
int main()
{
Demo a;
// 从此时刻起,a不再被使用
Demo b = a;
return 0;
}
打印结果:
通过std::move
将a
对象内部的m_p
通过移动构造,直接浅拷贝移动给b
:
int main()
{
Demo a;
// 从此时刻起,a不再被使用
Demo b = std::move(a);
return 0;
}
打印结果:
注意事项:
C++11标准中并没有规定被std::move()
后的原对象内部资源应当变成什么样,而交给类的开发者自行决定。所以!!被移动的对象应当确认在之后的程序中不会以任何形式被引用,或者会有未定义的行为发生。
2. 完美转发
[WIP]待补充。。
四、引申思考
回头看第一节中所说,是为了在语法层面,解决向C++中添加移动语义
,为什么要特意强调在语法层面呢?
可以把上述举的所有例子中,编译命令中的-fno-elide-constructors
去掉,重新编译执行试试,再进行一番思考。。