利用 SQLite 的递归表处理树型结构的数据

前言

众所周知,SQLite 是一种基于关系型的数据库系统,而关系型的数据库是一种一维的结构,它的表可以视作一种记录的线性表。而在实践中,树型结构也是非常常见的,为了能将树型结构的数据被 SQL 语言进行有效的查询和管理,SQLite 的 with 从句提供了一种递归语法,可以有效地对树和图等结构进行查询。

示例

下图是曹魏世系表,是一株典型的家谱树结构。其中曹操是根结点,当过皇帝的以圆表示,数字是当皇帝的顺序。

曹魏世系表

上图的数据可以用如下的表来表示,其中 father 指向自己父亲的 id。

id name father emperor_no
1 曹操
2 曹植 1
3 曹丕 1 1
4 曹彰 1
5 曹冲 1
6 曹宇 1
7 曹楷 4
8 曹芳 7 3
9 曹睿 3 2
10 曹霖 3
11 曹髦 10 4
12 曹奂 6 5

如果我们要求获取曹操所有的后代里,当过皇帝的人,并且按照代际顺序输出(子代->孙代->曾孙代)。这便是一个典型的广度优先搜索(Breadth First Search),该功能可用以下 SQL 语句进行查询:

with recursive
    cao as (
        select * from family where name = '曹操'
        union all
        select family.* from cao join family on cao.id = family.father
    )
select * from cao where emperor_no is not null;

SQLite 递归建表的核心是一条以 union(all) 连接的复合查询语句,其中 union 前面的语句构成递归搜索的起始数据,union 后的语句构成递归查询的生成语句(取出当前节点的所有子节点)。如果写过基于队列来对树形结构进行广度优先搜索,那么会对 SQLite 这一语法很容易理解:

  1. 在队列里产生初始数据
  2. 取出队列中的元素,输出该元素
  3. 将2步取出的元素,获取它的所有子节点,放入队列
  4. 继续进行第2步,直到队列为空

回到上面的例子,这一句就是取出根节点,也就是曹操

select * from family where name = '曹操'

而后面这一句,就是取出当前遍历节点的所有子节点,注意:虽然最终所有的输出结果都会到表cao里,但在生成语句里,cao指代的只是当前的遍历节点,它在生成语句里,只有一行数据。

select family.* from cao join family on cao.id = family.father

执行最终的搜索语句,结果如下:

id name father emperor_no
3 曹丕 1 1
9 曹睿 3 2
12 曹奂 6 5
11 曹髦 10 4
8 曹芳 7 3

深入内容

性能优化

对于普通的用 union all 构造的递归查询,虽然从逻辑上,SQLite 似乎是把递归搜索出来的结果放在一个新的表里,但由于 SQLite 有强大的查询优化器,它这张递归的输出结果是直接输出的,不会暂存数据,最终只会消耗较少的内存,而 union需要去重,就只能被迫临时存储表结果,这样会带来较多的内存消耗,因此如果没有什么特别的必要,应尽可能使用 union all 而不是 union

深度优先搜索

在默认的情况下,由于 SQLite 构造递归的模型是基于队列作为中间的遍历缓存结构,因此对于树型结构,最终的遍历顺序是广度优先,如果需要深度优先搜索的结果,可以在额外增加一个表示层次的字段,然后加上一个order by语句,以该字段降序排列即可。SQLite 的官方文档里有讨论:Controlling Depth-First Versus Breadth-First Search Of a Tree Using ORDER BY

限制递归表长度

在生成语句里加上 limit 从句即可。在 SQLite 的递归表查询的语境里,limit 的含义有了变化,它限制的不是生成语句所产生的记录总数,而是输出的递归表的总数,因此可以控制递归表的长度。

递归更新

SQLite 的递归查询功能是在 with 从句中实现的,该从句除了可以前置在 select 语句里,还可以前置在 update, delete, insert 等语句里。因此可以利用它的功能来实现递归更新等功能。不过如果递归更新含有顺序上的强关联,比如必须在子节点更新完了以后再更新父节点,恐怕光靠递归表查询还不够,需要自己写代码额外控制(比如先利用递归查询查出所有的节点并排好序,再依次执行更新语句)。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,482评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,377评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,762评论 0 342
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,273评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,289评论 5 373
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,046评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,351评论 3 400
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,988评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,476评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,948评论 2 324
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,064评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,712评论 4 323
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,261评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,264评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,486评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,511评论 2 354
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,802评论 2 345

推荐阅读更多精彩内容