Rust: String vs &str

Rust: String vs &str

funny_rust.jpg

当你开始第一次学习Rust的时候,不知不觉中就会开始对string类型感到困惑,并与编译器斗智斗勇:),通常你会认为那应该是一个string吧,然后编译器就说: Shut the fu*k up。 (努力保持微笑💪

为了帮读者弄清楚Rust中String, &String, str 和 &str的区别和联系,花了一点时间帮你们翻译了一篇文章并努力让它看起来不那么无聊 :)。(不用谢我💪,觉得有用的话点个赞叭,谢谢啦~

首先,我们来看一个炒鸡简单的函数:向老铁问好!

fn main() {
  let friend_name = "laotie";
  greet(friend_name);
}

fn greet(name: String) {
  println!("{}!, what's up", name);
}

如果你尝试编译这段代码,编译器就会教你做人(大雾

来看看错误信息叭

error[E0308]: mismatched types
 --> src/main.rs:3:9
  |
3 |   greet(friend_name);
  |         ^^^^^^^^^^^
  |         |
  |         expected struct `std::string::String`, found `&str`
  |         help: try using a conversion method: `friend_name.to_string()`

error: aborting due to previous error

For more information about this error, try `rustc --explain E0308`.

你可以在Rust-playground中运行这段代码,点"Run"就可以啦。

这里的错误信息还是很容易看懂的,greet函数本来想要一个std::string::String类型,但是你却给了它一个&str类型,所以出错啦,并且编译器还给出了可能的修正方法。所以按照编译器说的,把第三行改为let friend_name = "laotie".to_string()就可以了。

同时,它也引出了下面几个问题:

  • 这段代码的背后发生了什么?
  • 什么是&str
  • 为什么使用函数to_string()来进行显式转换?

理解String类型

要想回答这些问题,最好还是要理解Rust是如何将数据存储在内存中的,可以先去看看官方出品的Rust-Book。

如果你已经安装了Rust,可以在终端或者Powershell中输入: rustup doc --book,然后浏览器就会自动打开那本书了,俗称Rust中的"圣经"。

继续沿用前面的例子,我们来研究一下friend_name在内存中的布局,假设我们接受了编译器的建议:用to_string()将类型转换成了String

                    缓冲区(buffer)
                   /   容量(capacity)
                 /   /  长度(length)
               /   /   /
            +–––+–––+–––+
栈         │ • │ 8 │ 6 │ <- friend_name: String
            +–│–+–––+–––+
              │
            [–│–––––––––– 容量 ––––––––––––––]
              │
            +–V–+–––+–––+–––+–––+–––+–––+–––+
       堆   │ l │ a │ o │ t │ i │ e │   │   │
            +–––+–––+–––+–––+–––+–––+–––+–––+

            [–––––––– 长度 –––––––––]

Rust会将friend_name这个String对象存储在栈上,这个栈由一个指向缓冲区的堆分配指针,缓冲区的容量和数据的长度组成。有了这些玩意儿,这个String对象的大小(size)就总是保持确定并且为3个字长。

看到这里你可能会有疑惑,String中的容量和长度有什么不一样的吗?答案是区别很大,容量是指缓冲区的大小,而长度指的缓冲区里存放着的数据的长度。但更值得注意的是,当我们要改变这个String对象里所存储的内容时,它会重新申请缓冲区大小。比如,我们可以用push_str()方法在后面加一些内容(注意要在friend_name前加mut使其可变)。

let mut friend_name = "laotie"
friend_name.push_str(" shuang ji 666");

事实上,如果你已经非常了解Rust的Vec<T>类型,你早就知道String是啥了,当然如果这样你也不会在看这篇文章了hhh..

总结一下:String就是三个玩意组成的:指向缓冲区的堆分配指针,容量,长度。就这么简单~

理解字符串切片(str)

字符串切片(str)是我们引用别人拥有的字符串文本或者字符串字面量。

如果我们只对名字最后的“双击666”感兴趣,我们可以用如下方法得到部分字符串:

let mut friend_name = "laotie".to_string();
my_name.push_str( " shuang ji 666");

let last_text = &my_name[7..];

last_text现在是一个引用friend_name文本的字符串切片(注意,不是字符串切片str, 而是字符串切片的引用),它在内存中的布局如下:

         friend_name: String   last_text: &str
            [––––––––––––]    [–––––––]
            +–––+––––+––––+–––+–––+–––+
stack frame │ • │ 32 │ 20 │   │ • │13 │ 
            +–│–+––––+––––+–––+–│–+–––+
              │                 │
              │                 +–––––––––+
              │                           │
              │                           │
              │                         [–│––––––––––––––––––––– str –––––––––––––––––––––––]
            +–V–+–––+–––+–––+–––+–––+–––+–V–+–––+–––+–––+–––+–––+–––+–––+–––+–––+–––+–––+–––+
       heap │ l │ a │ o │ t │ i │ e │   │ s │ h │ u │ a │ n │ g │   │ j │ i │   │ 6 │ 6 │ 6 │ 
            +–––+–––+–––+–––+–––+–––+–––+–––+–––+–––+–––+–––+–––+–––+–––+–––+–––+–––+–––+–––+

注意到last_text没有在栈上存储容量信息。这是因为它只是另一个会自己管理容量的String对象的一个引用。重要的地方来了,字符串切片(str),是unsized的,即大小不确定的。好了,奇怪的事情又出现了,怎么会是不确定的呢?你一个个数也能知道它是13个呀。这是因为str是在堆上存储的,不能直接通过堆获取它的大小信息,因为堆是动态分配的(随时准备重新申请缓冲区大小)。但是&strfixed sized的,为什么?因为,它其实就是一个地址啊,引用本身就是我们常说的指针啊,它就是地址,比如0x8342e93ef..之类的。同样,在实际中,字符串切片永远是引用所以它们的类型是&str或者str。所以,如果我们以后谈到字符串切片,我们指的是&str而不是str切记

那么,&String又是个啥呢?,很好理解了呀,它是一个String对象的引用,就是一个地址: &String -> String(buffer, capcity, length) -> heap(buffer)

我想,这大概就解释清楚了String, &String, str&str之间的区别。

理解字符串字面量

看完上面那些,我想你大概已经有个感觉了,现在,我们要回答最核心的问题,即"laotie shuang ji 666"这段字符串字面量在Rust中到底是指什么?

回顾上面所讲的,如果我们要使用字符串切片&str,我们要么引用“别人”的字符串,要么自己创建一个字符串字面量。它就是指被一对双引号括起来的玩意:

let text = "I love Rust" //这是&str,不是String

接下来的问题是,如果说&str是别人的字符串的切片引用,那么字符串字面量是谁的切片引用呢?即这个字符串字面量在当前空间里属于谁呢?

结论是字符串字面量有一点特殊,它们是“预分配文本(preallocated text)”的字符串切片的引用,该文本作为可执行文件的一部分存储在只读(read-only)内存中。换句话说,它是我们程序中附带的“内存”,不依赖堆分配的缓冲区。

这就是说,在执行程序时,堆栈上仍然有一项指向该预分配的内存(preallocated memory):

            my_name: &str
            [–––––––––––]
            +–––+–––+
stack frame │ • │ 6 │ 
            +–│–+–––+
              │                 
              +––+                
                 │
 preallocated  +–V–+–––+–––+–––+–––+–––+
 read-only     │ l │ a │ o │ t │ i │ e │
 memory        +–––+–––+–––+–––+–––+–––+

用白话解释就是,要是它不属于任何人,那我就直接把它放在内存里,然后引用它就完事了,我不关心你到底是谁的,我只知道我能读取你的内容就行了。

读完以上内容,我还希望你注意到一点,&str所指向的字符串切片是不可修改的,因为它是只读的。

用哪个?

显然,这取决于许多因素,但是总的来说,可以肯定的是,如果我们所写的API不依赖于拥有或者改变这个在使用的字符串,它应该是&str的而不是String。于是,可以写出一个改进版本的问好函数:

fn greet(name: &str) {
  println!("Hello, {}!", name);
}

但是,等一下!如果这个API的调用者真的只有String类型且因为不明原因不能将其转为&str类型,咋办?

对Rust来说,完全不是问题,因为有一个超级强大的特性:强制解引用(deref coercing),允许你使用引用运算符&来转换任何传递的String引用,所以,在API被执行之前,&String转换为&str

fn main() {
  let name1 = "lao wang";
  let name2 = "zhang san".to_string();

  greet(name1);
  greet(&name2); // `name2`被通过引用传递
}

fn greet(name: &str) {
  println!("Hello, {}!", name);
}

代码

翻译完啦,其实这篇博客省去很多细节没讲,不过,该讲的重点,它们之间的区别,倒是讲清楚了,更多细节我会亲自写一篇博文专门介绍Rust中的字符串,有缘会再见,祝好!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 200,302评论 5 470
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 84,232评论 2 377
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 147,337评论 0 332
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,977评论 1 272
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,920评论 5 360
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,194评论 1 277
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,638评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,319评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,455评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,379评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,426评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,106评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,696评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,786评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,996评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,467评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,043评论 2 341