SQL删除重复数据的实例教程

更新时间：2022年07月05日 11:04:30 作者：qq_37705525

在使用SQL提数的时候,常会遇到表内有重复值的时候,下面这篇文章主要给大家介绍了关于SQL删除重复数据的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下

1 SQL去重

SQL中去除完全相同数据可以用distinct关键字，任意字段去重可以用group by，以下面的数据表为例。

2 distinct

存在两条完全相同的纪录，用关键字distinct就可以去掉

根据单个字段去重，能精确去重;

作用在多个字段时，只有当这几个字段的完全相同时，才能去重;

关键字distinct只能放在SQL语句中的第一个，才会起作用

一般用来返回不重复的记录条数，返回不重复的条数(去掉test重复的，就剩下6条)

3 group by

1. 查询根据名字去重后数据(名字相同取id值大的)

SELECT * FROM stu WHERE id IN (SELECT MAX(id) FROM stu GROUP BY `name`)

2. 删除名字相同数据(名字相同保留id值大的)

group by + count + max去掉重复数据

1）SELECT * FROM stu

2）加上group by 后，会将重复的数据去掉了

3) 条件(名字)是数量大于1的重复数据

SELECT `name` FROM stu GROUP BY `name` HAVING COUNT(`name`) > 1

#条件是数量大于1的重复数据
SELECT * FROM stu WHERE `name` IN(
SELECT `name` FROM stu GROUP BY `name` HAVING COUNT(`name`)>1 
)

4）查看某字段重复数据的id

SELECT id, COUNT(*) FROM stu 
GROUP BY NAME DESC HAVING(COUNT(*) > 0)

5）查询所有重复数据

SELECT * FROM stu WHERE NAME IN (SELECT `name` FROM stu GROUP BY `name` HAVING COUNT(`name`) > 1)

5) 去重

可以使用distinct去重（返回不重复的用户名）

删除多余的重复记录（name），只保留id最大的记录。

DELETE FROM stu 
WHERE id NOT IN ( SELECT a.id FROM ( SELECT MAX( id ) AS id FROM stu GROUP BY `name` )a )

或者

 DELETE FROM stu WHERE `name` IN (SELECT `name` FROM (SELECT `name` FROM stu GROUP BY `name` HAVING COUNT(`name`)>1) e)
 AND id NOT IN (SELECT id FROM (SELECT MAX(id) AS id FROM stu GROUP BY `name` HAVING COUNT(`name`)>1) t)
 #查询显示重复的数据都是显示最前面的几条，因此不需要查询是否最小值

错误删除

DELETE FROM stu WHERE name IN (SELECT name FROM stu GROUP BY name HAVING COUNT(name)>1)
AND id NOT IN (SELECT MAX(id) FROM stu GROUP BY stu HAVING COUNT(name)>1)

原因是：不能将直接查处来的数据当做删除数据的条件，我们应该先把查出来的数据新建一个临时表，然后再把临时表作为条件进行删除功能

4 总结

去重后名字记录

SELECT `name` FROM stu 
GROUP BY NAME HAVING(COUNT(*) > 0)

2）

所有重复名字的记录

SELECT `name` FROM stu 
GROUP BY NAME HAVING COUNT(*) > 1

3）把所有重复的记录都删了

DELETE FROM stu WHERE name IN
(SELECT name FROM stu GROUP BY name HAVING COUNT(*)>1)

无法在删除时同时查询这张表，这个问题只在MySQL中出现，oracle没有。怎么解决？我们只需要在查出结果以后加一张中间表。让执行器认为我们要查的数据不是来自正在删的这张表就可以了。

DELETE FROM stu WHERE `name` IN 
    (SELECT a.name FROM 
        (SELECT `name` FROM stu GROUP BY `name` HAVING COUNT(*)>1) a)

所有重复数据都删除, 就剩王五一条数据了

4) 现在删除所有重复数据数据做完了，考虑怎么保留重复数据中id最小的。只需要在删除时让删除该条的记录id不在重复数据id最小的当中就可以了。

DELETE FROM stu WHERE `name` IN 
    (SELECT a.name FROM 
        (SELECT `name` FROM stu GROUP BY `name` HAVING COUNT(*)>1) a)
     AND id NOT IN 
    (SELECT b.id FROM 
        (SELECT MIN(id) id FROM stu 
            GROUP BY `name` HAVING COUNT(*)>1) b);

还有简单办法算出去重后所有数据（保留最小ID），然后删除id不在该数组里的

 DELETE FROM stu WHERE id NOT IN (SELECT t.id FROM (SELECT MIN(id) AS id FROM stu GROUP BY `name`)t)

到此这篇关于SQL删除重复数据的文章就介绍到这了,更多相关SQL删除重复数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

MySQL多表查询实例详解【链接查询、子查询等】
这篇文章主要介绍了MySQL多表查询,结合实例形式详细分析了mysql多表查询中的链接查询、子查询等相关操作技巧与使用注意事项,需要的朋友可以参考下
2019-12-12
MySQL5.7 group by新特性报错1055的解决办法
项目中本来使用的是mysql5.6进行开发，切换到5.7之后，突然发现原来的一些sql运行都报错，错误编码1055，错误信息和sql_mode中的“only_full_group_by“有关。下面小编给大家分享下解决办法
2016-12-12
VMware中Linux共享mysql数据库的方法
VMware中Linux共享mysql数据库的方法，需要的朋友可以参考下。
2010-11-11
sql server自动编号的三种方法
自增列是最简单和常见的方法,适用于大多数情况,本文介绍了SQL Server中三种常见的自动编号方法：自增列、序列和触发器,具有一定的参考价值,感兴趣的可以了解一下
2023-10-10
mysql如何定时自动新增分区
这篇文章主要介绍了mysql如何定时自动新增分区问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
2023-09-09
MySQL 连接查询的原理和应用
这篇文章主要介绍了MySQL 连接查询的原理和应用，帮助大家更好的理解和学习MySQL数据库，感兴趣的朋友可以了解下
2020-11-11
MySQL备份与恢复之冷备（1）
这篇文章主要介绍了MySQL备份与恢复之冷备，冷备一般需要定制计划，比如什么时候做备份，每次对哪些数据进行备份等等，对冷备感兴趣的小伙伴们可以参考一下
2015-08-08
MySQL字符集 GBK、GB2312、UTF8区别解决MYSQL中文乱码问题
MYSQL中文乱码问题原因有很多，脚本之家以前发布过很多相关文章，这篇文章介绍mysql相关的一些知识更详细
2012-08-08
mysql安装忘记初始密码简单有效的解决方法
在本篇文章里小编给大家整理的是一篇关于mysql安装忘记初始密码简单有效的解决方法，有需要的朋友们参考学习下。
2020-01-01
MySQL Installer 8.0.21安装教程图文详解
这篇文章主要介绍了MySQL Installer 8.0.21安装教程,本文通过图文并茂的形式给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2020-08-08