Mysql批量插入数据时该如何解决重复问题详解

更新时间：2022年11月10日 10:09:28 作者：头秃的程序员小王

之前写的代码批量插入遇到了问题,原因是有重复的数据（主键或唯一索引冲突）,所以插入失败,下面这篇文章主要给大家介绍了关于Mysql批量插入数据时该如何解决重复问题的相关资料,需要的朋友可以参考下

前言

当数据库中存量数据较多时，或者是在批量插入操作时，很容易出现插入重复数据的问题。

一、三种方法

在 mysql 中，当存在主键冲突或唯一键冲突的情况下，根据插入策略不同，一般有以下三种避免方法：

insert ignore into：若没有则插入，若存在则忽略

replace into：若没有则正常插入，若存在则先删除后插入

insert into ... on duplicate key update：若没有则正常插入，若存在则更新

注意，使用以上方法的前提是表中有一个 PRIMARY KEY 或 UNIQUE 约束/索引，否则，使用以上三个语句没有特殊意义，与使用单纯的 INSERT INTO 效果相同。

测试表结构：

测试表数据：

二、细节

2.1、insert ignore into

insert ignore 会根据主键或者唯一键判断，忽略数据库中已经存在的数据,若数据库没有该条数据，就插入为新的数据，跟普通的 insert into 一样。若数据库有该条数据，就忽略这条插入语句，不执行插入操作。

insert ignore into student(age) values (12),(13);

age=12的数据已存在，因此未插入（根据创建时间可得），age=13的数据不存在，因此成功插入

2.2 、insert into ... on duplicate key update

在 insert into 语句末尾指定 on duplicate key update，会根据主键或者唯一键判断：若数据库有该条数据，则直接更新原数据，相当于 update，若数据库没有该条数据，则插入为新的数据，跟普通的 insert into 一样。

insert into student(age) values (12),(13) 
ON DUPLICATE KEY UPDATE student.created_at = '2022-01-01 00:00:00';

age=12的记录已存在，因此created_at字段被更新。age=13的记录不存在，因此成功插入

2.3、replace into

 replace into student(age) values (12),(13);

age=12的记录已存在，因此被删除重新插入（由createdAt值可知）。age=13的记录不存在，因此成功插入

replace into 会根据主键或者唯一键判断：

若表中已存在该数据，则先删除此行数据，然后插入新的数据，相当于 delete + insert
可能会丢失数据、主从服务器的 AUTO_INCREMENT 不一致。
若表中不存在该数据，则直接插入新数据，跟普通的 insert into 一样

三、总结

1）在主键冲突情况下，三种方法都可以使用

2）在唯一键冲突情况下，且有自增主键时：三种方法都会出现 AUTO_INCREMENT 不连续问题，且这种不连续不会同步更新到 slave 的 AUTO_INCREMENT。当 master 被 kill，且 slave 升级为 master 时，就会出现主键冲突问题。（因为事务原因，即使没有插入成功，也会占用一个自增id。row模式binlog下，主从的数据同步是一致的，主键也一致。有没有影响取决于主从同步模式）

statement格式：binlog记录的是实际执行的sql语句
row格式：binlog记录的是变化前后的数据（涉及所有列），形如update table_a set col1=value1, col2=value2 ... where col1=condition1 and col2=condition2 ...
mixed格式：默认选择statement格式，只在需要时改用row格式

3）replace into 方法可能会导致部分数据丢失。

到此这篇关于Mysql批量插入数据时该如何解决重复问题的文章就介绍到这了,更多相关Mysql批量插入数据重复问题内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

高效数据流转：Mycat分库分表与GreatSQL实时同步
聚焦数据库扩容与实时数据同步,探索MyCat分库分表与GreatSQL的强大结合！想在大规模数据处理中游刃有余？本指南将带你轻松掌握MyCat的分布式解决方案和GreatSQL的实时同步机制,让高效、稳定的数据库管理触手可及,一起揭开高并发环境下数据库优化的神秘面纱吧！
2024-01-01
MySQL 丢失数据的原因及解决
这篇文章主要介绍了MySQL 丢失数据的原因及解决，帮助大家更好的理解和学习使用MySQL数据库，感兴趣的朋友可以了解下
2021-05-05
利用MySQL加密函数保护Web网站敏感数据的方法分享
如果您正在运行使用MySQL的Web应用程序，那么它把密码或者其他敏感信息保存在应用程序里的机会就很大
2012-03-03
mysql单表查询及多表查询命令详解
这篇文章主要介绍了mysql单表查询及多表查询命令详解,本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2023-07-07
mysql中limit的用法深入分析
本篇文章是对mysql中limit的用法进行了详细的分析介绍，需要的朋友参考下
2013-06-06
强制修改mysql的root密码的六种方法分享（mysql忘记密码）
下面我们提供了6种不同的修改mysql root用户的密码，与增加mysql用户的方法
2011-11-11
Mysql DateTime 查询问题解析
这篇文章主要为大家介绍了Mysql DateTime查询问题解析，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪
2022-11-11
php mysql访问数据库的步骤详解
这篇文章主要介绍了php mysql访问数据库的步骤详解的相关资料,需要的朋友可以参考下
2016-10-10
Mysql 下中文乱码的问题解决方法总结
这篇文章主要介绍了Mysql 下中文乱码的问题解决方法总结的相关资料,这里提供了解决 Mysql 中文乱码问题的办法，需要的朋友可以参考下
2016-11-11
MySQL AUTO_INCREMENT 主键自增长的实现
本文主要介绍了MySQL AUTO_INCREMENT 主键自增长的实现,每增加一条记录,主键会自动以相同的步长进行增长,具有一定的参考价值,感兴趣的可以了解一下
2023-11-11