LevelDB:读操作

前面写了两篇文章介绍 LevelDB 的整体架构接口使用。这篇文章,我们从代码的角度看看 LevelDB 的设计与实现,先从读操作开始。

LevelDB 的版本更新不是很频繁,整体变化不大。本文的源代码参考和索引的版本是 LevelDB v1.20

LevelDB 的目录结构很简单,就不用介绍了,直接进入正题吧。

leveldb::DB

LevelDB 暴露给外部的操作接口都封装在 leveldb::DB 这个抽象类里,具体实现是 leveldb::DBImpl 。使用时,leveldb::DB 用于引用一个 LevelDB 实例。一个 LevelDB 实例可以简单认为是一个支持并发读写和持久化的 map。

LevelDB 暴露给外部的操作接口都很简单,具体可以根据上面提供的索引链接看看代码和注释。

读操作

leveldb::DB::Get 根据 Key 获取 Value,先看看函数的原型:

virtual Status Get(const ReadOptions& options, const Slice& key, std::string* value) = 0;

leveldb::ReadOptions 是读操作的一些参数。verify_checksumsfill_cache 是两个偏优化的参数,重点是 snapshot 参数,表示本次读操作要从哪个 Snapshot 读取。snapshot 默认是 NULL,此时 LevelDB 会从当前 Snapshot 读取。

讲到 Snapshot,我们顺便来看看 leveldb::Snapshot 的实现。leveldb::Snapshot是个空壳,具体实现是在 leveldb::SnapshotImpl ,也相当简单,和 Snapshot 相关的变量只有一个 number_ (SequenceNumber) —— 不难看出 LevelDB 是通过维护一个 Sequence Number 来实现快照功能。

LevelDB 单个 Key 的读取操作的具体实现是 leveldb::DBImpl::Get 。我们来看看读操作的过程:

  1. 获取互斥锁
  2. 获取本次读操作的 Sequence Number:如果 ReadOptions 参数的 snaphot 不为空,则使用这个 snapshot 的 Sequence Number;否则,默认使用 LastSequence(LastSequence 会在每次写操作后更新)。
  3. MemTable, Immutable Memtable 和 Current Version 增加引用计数,避免在读取过程中被后台线程进行 Compaction 时“垃圾回收”了。Version 主要用来维护 SST 文件的版本信息。
  4. 释放互斥锁下面 5 和 6 两步是没有持有锁的,特别是第 6 步
  5. 构造 LookupKey
  6. 查找
    1. 从 MemTable 查找
    2. 从 Immutable Memtable 查找
    3. 从 SST 文件查找
  7. 获取互斥锁
  8. 更新 SST 文件的统计信息,根据统计结果决定是否调度后台 Compaction
  9. MemTable, Immutable Memtable 和 Current Version 减少引用计数
  10. 释放锁(由析构函数完成),返回结果

MemTable

上面分析读流程的时候,可以发现第 6 步,从 Memtable、Immutable Memtable 和 Current Version 指向的 SST 文件查找内容是不需要持有锁的。这样做没有并发读写的问题吗?

简单分析一下:引用计数保证了相关文件和内存数据结构不会被回收,而 Immutable Memtable 和 SST 文件都是只读的,没有并发读写问题。所以,只要看 MemTable 是否支持并发读写

leveldb::MemTable 底层的实现是 leveldb::SkipList 。在 leveldb::SKipList 有一段注释说明 ,简单地说就是:

  1. 写写冲突需要外部同步。
  2. 读写冲突不需要外部同步,只要保证 SkipList 不会被垃圾回收就好。
  3. 这里的 SkipList 只插入,不修改和删除

因此,从这段注释可以看出,MemTable 支持一写多读同时并发操作。后面有机会聊到 LevelDB 的写操作再来介绍一下 SkipList 的 Insert 操作如何实现读写并发不需要锁。

LookupKey

LevelDB 通过 user_key 和 sequence 构造 leveldb::LookupKey ,用于 LevelDB 内部接口的查找。参考 LookupKey 的代码和注释 ,其格式为:

LookupKey.png
  1. klength 的类型是 varint32,是 leveldb 内部编码的可变长度的 uint32_t,存储 userkey + tag 的长度表示一个 varint32 最多需要 5 个字节
  2. userkey 就是一个 userkey 的 char 数组。
  3. tag 是使用 LittleEndian 编码的 uint64,其组成是 7 字节的 sequence 和 1 字节的 value_type。
  4. 所以,一个 LookupKey 的最大长度为: 5 + userkey size + 8 = userkey size + 13

SST 文件的查找

LevelDB 中将 SST 文件的管理实现成 leveldb::Version ,同时实现了 leveldb::VersionSet 管理多个 Version —— 因为 LevelDB 要支持 MVCC 所以可能同时存在多个版本。

查找的时候,获取当前版本 current , 调用 leveldb::Version::Get 在 SST 上进行查找。

  1. 从 level0 开始一层一层查找 —— 小 level 的数据比大 level 新,所以如果先找到了的话可以直接返回。
  2. 在要查找的 level 收集需要查找的文件。level0 的 sst 文件比较特殊,是直接由 Immutable MemTable dump 得到的,因此,每个文件的 key 范围可能重叠。level0 可能需要查找多个文件,其它 level 的 文件的 key 不会重叠,至多只需要读一个文件。
  3. 对步骤 2 收集到的文件进行查找。具体查找逻辑由 leveldb::TableCache::Get 实现。这里面涉及一些 Cache 相关的实现,暂时略过。
  4. 查找过程会记录一些统计信息:如果不止读取一个 sst 文件,则记录最后读取的是哪个 level 的哪个文件。

读触发的 Compaction

读取结束后,如果不止读取一个 sst 文件,则更新统计信息,决定是否触发 Compaction。更新统计信息时,直接将记录的文件的 leveldb::FileMetaData 的 allowed_seeks 减一,当 allowed_seeks <= 0时,表示读取效率很低,需要执行 Compaction,减少这条路径上的文件数量。

调用 MaybeScheduleCompaction 尝试调度后台线程的 Compaction。

小结

这里只是简单介绍了 LevelDB 的读操作的大概情况。实际上,LevelDB 的读操作涉及很多东西,如:写操作相关的并发读写、Sequence Number 等;Compaction 相关的 Version、VersionSet等;读操作还有可能触发 Compaction;还有 Table Cache、Block Cache 这些相关的东西没提及。

参考文档

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342

推荐阅读更多精彩内容

  • 版本控制或元信息管理,是LevelDB中比较重要的内容。本文首先介绍其在整个LevelDB中不可替代的作用;之后从...
    CatKang阅读 5,447评论 12 12
  • LevelDB是Google传奇工程师Jeff Dean和Sanjay Ghemawat开源的KV存储引擎,无论从...
    CatKang阅读 4,811评论 5 25
  • 通过之前对LevelDB的整体流程,数据存储以及元信息管理的介绍,我们已经基本完整的了解了LevelDB。接下来两...
    CatKang阅读 3,672评论 0 5
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,587评论 18 139
  • 作为一个存储引擎,数据存储自然是LevelDB重中之重的需求。我们已经在庖丁解LevelDB之概览中介绍了Leve...
    CatKang阅读 4,509评论 2 11