今天在实际开发过程中遇到一个数据库去重查询的问题,在这里给大家分享一下。
类似于上面这张数据表,我们发现id=5和id=6的数据passWord和userName数据是一样的。我们的需求是去掉重复的数据(passWord,userName)获得结果集,去重的条件就是根据passWord和userName两个字段。
利用 distinct
我们知道,mysql提供了数据去重的方法,利用distinct关键字对需要处理的字段进行去重。我们来看一下效果。
咦?不对啊,为什么只返回了需要去重处理的字段,而我们想要的结果是对所有字段的返回啊。为什么啊?所以我们来简单了解下distinct的用法。在实际应用中,distinct是用来返回非重复记录的条数,而不能返回非重复数据的结果集。这是因为使用distinct之后只能返回去重的字段,而不能返回其他的字段。这显然不是我们所需要的。既然distinct满足不了我们的需求,我们来换一种查询方式。
利用 group by
我们知道除了使用distinct关键字外还可以使用group by关键字对去重数据进行去重查询,来试一下。
看效果确实是符合了我们的需求,但是我们的需求又变了,需要添加一个查询条件,比如说根据id进行去重查询,我们再来看下。
提示很友好,告诉我们这条sql是错误的,这是因为where是对数据集进行筛选的,而group by 是对结果集进行聚集,在执行书序上来说group by 是在where筛选后才执行的,再来简单看下sql的执行顺序。
sql执行顺序
SELECT DISTINCT <select_list>
FROM <left_table>
<join_type> JOIN <right_table>
ON <join_condition>
WHERE <where_condition>
GROUP BY <group_by_list>
HAVING <having_condition>
ORDER BY <order_by_condition>
LIMIT <limit_number>
看到这里我们就知道为什么sql会报错了,所以,要想符合我们的要求可以使用having关键字,因为having执行顺序位于group by之后,而且having是搭配group by一起来使用的,再来看下。
使用having
select * from user GROUP BY `passWord`,userName HAVING id = "1"
利用having关键字对结果集进行过滤后终于达到了符合我们要求的结果。这样就实现了对数据的去重查询。
where 和 having区别
1、having用于groyup by之后。
2、where是用于表中筛选查询,having用于在where和group 结果中查询。
3、havin可以使用聚合函数,而where 不能。
4、having执行顺序位于where之后。