eg:
假定数据库结构如下:
CREATE TABLE `blog` (
`id` bigint(20) unsigned NOT NULL COMMENT '主键ID',
`type` tinyint(4) NOT NULL COMMENT '主题,1:生活,2:技术,3:体育',
`views` bigint(20) NOT NULL DEFAULT '0' COMMENT '阅读数',
`blog` varchar(45) NOT NULL COMMENT '博客名称',
PRIMARY KEY (`id`),
KEY `IDX_TYPE` (`type`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='博客表'
Q:对一组数据进行分组,并按照某一列进行排序,查询指定的前几位数据,根据上面的数据结构如何查询不同主题下阅读数排名前三的文章。
A:
- 惯性思维,用代码完成:按照不同主题查询排名前3的数据,再进行组装,这种方式需要多次查询数据库,适合主题选择种类比较少的场景,在一些博客网站下,主题分类比较多,不适用。
SELECT
*
FROM
blog
WHERE
type = 1
ORDER BY views DESC
LIMIT 0 , 3;
- 换种思维方式,问题可以理解为给每条记录按照主题分类,按照阅读数排序,查询排名前三的数据,同样我们可以查询每条记录在该主题下,有多少其他记录的阅读数超过该条记录的阅读数,eg:生活主题下的10篇文章,查询排名前三的,针对每条记录,统计超过这条记录阅读量的文章总和,如果统计出来的数量<=3的就是结果。
SELECT * FROM (SELECT b1.*,(SELECT COUNT(1) FROM blog b2 WHERE b1.type = b2.type AND b2.views > b1.views) AS top
FROM blog b1) tmp WHERE tmp.top < 3;
SELECT * FROM blog b1
WHERE (SELECT COUNT(1) FROM blog b2 WHERE b1.type = b2.type AND b2.views > b1.views)<3;
优点:只需一个简单SQL即可搞定,缺陷也很明显,就是增加了SQL的复杂度,每条记录都需要做一次统计,在数据量比较大的情况下,效率会很低。
总结:
两种方式的优缺点都很明显,方案选型要结合实际的使用场景。