从业以来主要在做客户端,用到的数据库都是表结构比较简单的 SQLite,以我那还给老师一大半的 SQL 水平倒也能对付。现在偶尔需要到后台的 SQL Server 里追查一些数据问题,就显得有点捉襟见肘了,特别是各种 JOIN,有时候傻傻分不清楚,于是索性弄明白并做个记录。
前言
在各种问答社区里谈及 SQL 里的各种 JOIN 之间的区别时,最被广为引用的是 CodeProject 上 C.L. Moffatt 的文章 Visual Representation of SQL Joins,他确实讲得简单明了,使用文氏图来帮助理解,效果明显。本文将沿用他的讲解方式,稍有演绎,可以视为该文较为粗糙的中译版。
约定
下文将使用两个数据库表 Table_A 和 Table_B 来进行示例讲解,其结构与数据分别如下:
mysql> SELECT * FROM Table_A ORDER BY PK ASC;
+----+------------+
| PK | Value |
+----+------------+
| 1 | FOX |
| 2 | COP |
| 3 | TAXI |
| 4 | LINCION |
| 5 | ARIZONA |
| 6 | WASHINGTON |
| 7 | DELL |
| 10 | LUCENT |
+----+------------+
8 rows in set (0.00 sec)
mysql> SELECT * from Table_B ORDER BY PK ASC;
+----+-----------+
| PK | Value |
+----+-----------+
| 1 | TROT |
| 2 | CAR |
| 3 | CAB |
| 6 | MONUMENT |
| 7 | PC |
| 8 | MICROSOFT |
| 9 | APPLE |
| 11 | SCOTCH |
+----+-----------+
8 rows in set (0.00 sec)
常用的 JOIN
INNER JOIN
INNER JOIN 一般被译作内连接。内连接查询能将左表(表 A)和右表(表 B)中能关联起来的数据连接后返回。
文氏图:
示例查询:
SELECT A.PK AS A_PK, B.PK AS B_PK,
A.Value AS A_Value, B.Value AS B_Value
FROM Table_A A
INNER JOIN Table_B B
ON A.PK = B.PK;
查询结果:
+------+------+------------+----------+
| A_PK | B_PK | A_Value | B_Value |
+------+------+------------+----------+
| 1 | 1 | FOX | TROT |
| 2 | 2 | COP | CAR |
| 3 | 3 | TAXI | CAB |
| 6 | 6 | WASHINGTON | MONUMENT |
| 7 | 7 | DELL | PC |
+------+------+------------+----------+
5 rows in set (0.00 sec)
注:其中A为Table_A的别名,B为Table_B的别名,下同。
LEFT JOIN
LEFT JOIN 一般被译作左连接,也写作 LEFT OUTER JOIN。左连接查询会返回左表(表 A)中所有记录,不管右表(表 B)中有没有关联的数据。在右表中找到的关联数据列也会被一起返回。
文氏图:
示例查询:
SELECT A.PK AS A_PK, B.PK AS B_PK,
A.Value AS A_Value, B.Value AS B_Value
FROM Table_A A
LEFT JOIN Table_B B
ON A.PK = B.PK;
查询结果:
+------+------+------------+----------+
| A_PK | B_PK | A_Value | B_Value |
+------+------+------------+----------+
| 1 | 1 | FOX | TROT |
| 2 | 2 | COP | CAR |
| 3 | 3 | TAXI | CAB |
| 4 | NULL | LINCION | NULL |
| 5 | NULL | ARIZONA | NULL |
| 6 | 6 | WASHINGTON | MONUMENT |
| 7 | 7 | DELL | PC |
| 10 | NULL | LUCENT | NULL |
+------+------+------------+----------+
8 rows in set (0.00 sec)
RIGHT JOIN
RIGHT JOIN 一般被译作右连接,也写作 RIGHT OUTER JOIN。右连接查询会返回右表(表 B)中所有记录,不管左表(表 A)中有没有关联的数据。在左表中找到的关联数据列也会被一起返回。
文氏图:
示例查询:
SELECT A.PK AS A_PK, B.PK AS B_PK,
A.Value AS A_Value, B.Value AS B_Value
FROM Table_A A
RIGHT JOIN Table_B B
ON A.PK = B.PK;
查询结果:
+------+------+------------+-----------+
| A_PK | B_PK | A_Value | B_Value |
+------+------+------------+-----------+
| 1 | 1 | FOX | TROT |
| 2 | 2 | COP | CAR |
| 3 | 3 | TAXI | CAB |
| 6 | 6 | WASHINGTON | MONUMENT |
| 7 | 7 | DELL | PC |
| NULL | 8 | NULL | MICROSOFT |
| NULL | 9 | NULL | APPLE |
| NULL | 11 | NULL | SCOTCH |
+------+------+------------+-----------+
8 rows in set (0.00 sec)
FULL OUTER JOIN
FULL OUTER JOIN 一般被译作外连接、全连接,实际查询语句中可以写作FULL OUTER JOIN
或FULL JOIN
。外连接查询能返回左右表里的所有记录,其中左右表里能关联起来的记录被连接后返回。
文氏图:
示例查询:
SELECT A.PK AS A_PK, B.PK AS B_PK,
A.Value AS A_Value, B.Value AS B_Value
FROM Table_A A
FULL OUTER JOIN Table_B B
ON A.PK = B.PK;
查询结果:
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'FULL OUTER JOIN Table_B B
ON A.PK = B.PK' at line 4
注:我当前示例使用的 MySQL 不支持FULL OUTER JOIN
。
应当返回的结果(使用 UNION 模拟):
mysql> SELECT *
-> FROM Table_A
-> LEFT JOIN Table_B
-> ON Table_A.PK = Table_B.PK
-> UNION ALL
-> SELECT *
-> FROM Table_A
-> RIGHT JOIN Table_B
-> ON Table_A.PK = Table_B.PK
-> WHERE Table_A.PK IS NULL;
+------+------------+------+-----------+
| PK | Value | PK | Value |
+------+------------+------+-----------+
| 1 | FOX | 1 | TROT |
| 2 | COP | 2 | CAR |
| 3 | TAXI | 3 | CAB |
| 4 | LINCION | NULL | NULL |
| 5 | ARIZONA | NULL | NULL |
| 6 | WASHINGTON | 6 | MONUMENT |
| 7 | DELL | 7 | PC |
| 10 | LUCENT | NULL | NULL |
| NULL | NULL | 8 | MICROSOFT |
| NULL | NULL | 9 | APPLE |
| NULL | NULL | 11 | SCOTCH |
+------+------------+------+-----------+
11 rows in set (0.00 sec)
小结
以上四种,就是 SQL 里常见 JOIN 的种类和概念了,看一下它们的合影:
有没有感觉少了些什么,学数学集合时完全不止这几种情况?确实如此,继续看。
延伸用法
LEFT JOIN EXCLUDING INNER JOIN
返回左表有但右表没有关联数据的记录集。
文氏图:
示例查询:
SELECT A.PK AS A_PK, B.PK AS B_PK,
A.Value AS A_Value, B.Value AS B_Value
FROM Table_A A
LEFT JOIN Table_B B
ON A.PK = B.PK
WHERE B.PK IS NULL;
查询结果:
+------+------+---------+---------+
| A_PK | B_PK | A_Value | B_Value |
+------+------+---------+---------+
| 4 | NULL | LINCION | NULL |
| 5 | NULL | ARIZONA | NULL |
| 10 | NULL | LUCENT | NULL |
+------+------+---------+---------+
3 rows in set (0.00 sec)
RIGHT JOIN EXCLUDING INNER JOIN
返回右表有但左表没有关联数据的记录集。
文氏图:
示例查询:
SELECT A.PK AS A_PK, B.PK AS B_PK,
A.Value AS A_Value, B.Value AS B_Value
FROM Table_A A
RIGHT JOIN Table_B B
ON A.PK = B.PK
WHERE A.PK IS NULL;
查询结果:
+------+------+---------+-----------+
| A_PK | B_PK | A_Value | B_Value |
+------+------+---------+-----------+
| NULL | 8 | NULL | MICROSOFT |
| NULL | 9 | NULL | APPLE |
| NULL | 11 | NULL | SCOTCH |
+------+------+---------+-----------+
3 rows in set (0.00 sec)
FULL OUTER JOIN EXCLUDING INNER JOIN
返回左表和右表里没有相互关联的记录集。
文氏图:
示例查询:
SELECT A.PK AS A_PK, B.PK AS B_PK,
A.Value AS A_Value, B.Value AS B_Value
FROM Table_A A
FULL OUTER JOIN Table_B B
ON A.PK = B.PK
WHERE A.PK IS NULL
OR B.PK IS NULL;
因为使用到了 FULL OUTER JOIN,MySQL 在执行该查询时再次报错。
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'FULL OUTER JOIN Table_B B
ON A.PK = B.PK
WHERE A.PK IS NULL
OR B.PK IS NULL' at line 4
应当返回的结果(用 UNION 模拟):
mysql> SELECT *
-> FROM Table_A
-> LEFT JOIN Table_B
-> ON Table_A.PK = Table_B.PK
-> WHERE Table_B.PK IS NULL
-> UNION ALL
-> SELECT *
-> FROM Table_A
-> RIGHT JOIN Table_B
-> ON Table_A.PK = Table_B.PK
-> WHERE Table_A.PK IS NULL;
+------+---------+------+-----------+
| PK | Value | PK | Value |
+------+---------+------+-----------+
| 4 | LINCION | NULL | NULL |
| 5 | ARIZONA | NULL | NULL |
| 10 | LUCENT | NULL | NULL |
| NULL | NULL | 8 | MICROSOFT |
| NULL | NULL | 9 | APPLE |
| NULL | NULL | 11 | SCOTCH |
+------+---------+------+-----------+
6 rows in set (0.00 sec)
总结
以上七种用法基本上可以覆盖各种 JOIN 查询了。七种用法的全家福:
看着它们,我仿佛回到了当年学数学,求交集并集的时代……
顺带张贴一下 C.L. Moffatt 带 SQL 语句的图片,配合学习,风味更佳:
补充说明
文中的图使用 Keynote 绘制;
个人的体会是 SQL 里的 JOIN 查询与数学里的求交集、并集等很像;
SQLite 不支持 RIGHT JOIN 和 FULL OUTER JOIN,可以使用 LEFT JOIN 和 UNION 来达到相同的效果;
MySQL 不支持 FULL OUTER JOIN,可以使用 LEFT JOIN 和 UNION 来达到相同的效果;
还有更多的 JOIN 用法,比如 CROSS JOIN(迪卡尔集)、SELF JOIN,目前我还未在实际应用中遇到过,且不太好用图来表示,所以并未在本文中进行讲解。如果需要,可以参考 SQL JOINS Slide Presentation 学习。
参考
Visual Representation of SQL Joins
How to do a FULL OUTER JOIN in MySQL?
SQL JOINS Slide Presentation
1、具有1-5工作经验的,面对目前流行的技术不知从何下手,需要突破技术瓶颈的可以加群。
2、在公司待久了,过得很安逸,但跳槽时面试碰壁。需要在短时间内进修、跳槽拿高薪的可以加群。
3、如果没有工作经验,但基础非常扎实,对java工作机制,常用设计思想,常用java开发框架掌握熟练的,可以加群。
4、觉得自己很牛B,一般需求都能搞定。但是所学的知识点没有系统化,很难在技术领域继续突破的可以加群。
- 群号:高级架构群 647631030备注好信息!
6.阿里Java高级架构师免费大牛直播讲解知识点,分享知识,多年工作经验的梳理和总结,带着大家全面、科学地建立自己的技术体系和技术认知!