数据库的数据结构(1)——key-value

数据库的日志系统

许多数据库内部使用日志,日志是一个只支持追加更新的记录序列的集合,通常存储了大量的数据。如果每查询一条数据要从头到位扫描整个数据文件来查找数据所在的位置,查找的开销是O(n),并不是是十分友好。为了高效从数据库中查找到特定的值,需要新的数据结构:索引。

索引是基于原始数据派生而来的额外数据结构,许多数据库允许单独增加和删除索引,而不影响数据库的内容,只影响查询性能。维护额外的数据结构必然带来额外的写入开销。对于写入,很难超过单纯以追加文件方式的性能。

适当的索引可以加速读取查询,但每个索引都会减慢写速度。

key-value哈希索引

key-value类型不是唯一可以索引的数据,但是它是其他更复杂索引的基础构造模块。key-value存储和大多数编程语言所内置的字典结构十分相似,通常使用hash map/hash table来实现。

1、哈希表索引的局限性与优点

局限性:_

  • 哈希表必须全部放入内存,如果有大量的key,可能存在内存不足的现象。原则上可以在磁盘上维护hash map,但是当哈希变满的时候,哈希表继续增长需要付出的代价比较昂贵,并且哈希冲突时候需要更加复杂的处理逻辑。
  • 区间查询效率不高。比如不能简单支持扫面abc0000和abc9999区间内所有的键,只能逐个查询。
    因此为了解决这些局限性,后续会介绍其它索引针对不同缺陷所进行的优化方式。
    优点:
  • 追加和分段合并主要是顺序写,比随机写入快。
  • 若果段文件是追加的或者不可变的,并发和崩溃恢复则简单许多,比如不必担心在重写值时发生崩溃的情况,留下一个包含部分旧值和部分新值混杂在一起的文件。
  • 合并旧段课程避免数据文件碎片化。

2、哈希表索引的简单模型

使用类csv格式的文件存储key-value对,将key存入内存中对hash map进行索引,每次写入只能进行追加操作。

如果只追加到一个文件,但是磁盘空间是有限到,为了避免耗尽空间,需要将日志分解为一定大小的段,当文件达到一定大小的时候就关闭它,将后续写入到新的文件中,然后压缩这些段文件(去掉重复段键,只保留最新更新)。

由于段在写入后不会更改,所以被合并的段需要写入另一个新的段文件。段文件段合并和压缩过程中会将旧的段文件冻结,当其它线程运行时依旧可以使用旧的段文件进行正常读取和写请求,当合并完成后将读取请求切换到新段合并段上,旧的段文件可以安全删除。

需要解决的一些细节问题:

  • 删除记录
    在需要删除的key的位置添加删除符,在合并段的时候抛弃/
  • 奔溃修复
    机器重启后内存中的hash map可能会消失,可以将每个段的hash map的快照存在磁盘上。
  • 并发控制
    单线程写入保证严格的先后顺序,多线程读取。
  • 部分写入
    数据库随时可能奔溃,包括将记录追加到日志的过程中,因此需要有一个校验值发现损坏的部分并丢弃。
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,236评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,867评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,715评论 0 340
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,899评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,895评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,733评论 1 283
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,085评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,722评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,025评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,696评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,816评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,447评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,057评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,009评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,254评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,204评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,561评论 2 343

推荐阅读更多精彩内容