MySQL主从复制故障排查及解决方案

 更新时间:2026年03月04日 08:51:58   作者:·云扬·  
在 MySQL 生产运维里,主从复制是数据备份、读写分离、高可用架构的核心,但配置、网络、磁盘、数据一致性、日志清理等问题,总能让复制突然中断,因此本文给大家介绍了MySQL主从复制故障排查及解决方案,需要的朋友可以参考下

引言

在 MySQL 生产运维里,主从复制是数据备份、读写分离、高可用架构的核心,但配置、网络、磁盘、数据一致性、日志清理等问题,总能让复制突然中断。

今天我把实战中 9 类高频主从复制故障整理成文,包含问题模拟、报错分析、分步解决方案,遇到问题直接对照处理,高效救场!

1. server_id 重复导致复制中断

问题现象

从库启动复制报错:server_id of slave is equal to server_id of master,IO 线程无法启动。

解决方案

  1. 主从节点 server_id 必须唯一,修改从库:
set global server_id=唯一ID;
  1. 重启复制并验证:
stop slave;
start slave;
show slave status\G

看到 Slave_IO_Running/Slave_SQL_Running 均为 Yes 即恢复。

2. 主从 3306 端口不通

问题现象

从库状态显示 Slave_IO_Running: Connecting,报错连接超时 / 拒绝。

解决方案

  1. 主库放行从库 IP 的 3306 端口,清空拦截规则:
iptables -D INPUT 规则行号
  1. 从库验证端口连通性:
telnet 主库IP 3306
  1. 重启复制即可恢复。

3. 从库磁盘空间满

问题现象

磁盘使用率 100%,复制延迟飙升,甚至 MySQL 进程崩溃。

解决方案

  1. 清理无用大文件、过期日志:
rm -f 无用文件
  1. 磁盘释放后重启 MySQL 与复制:
/etc/init.d/mysql.server start
stop slave; start slave;

4. 主从数据冲突(对象已存在)

问题现象

从库已有主库要同步的库 / 表,SQL 线程中断。

解决方案

  • GTID 模式:跳过冲突事务
stop slave;
set @@session.gtid_next=冲突GTID;
begin; commit;
set session gtid_next='AUTOMATIC';
start slave;
  • 位点模式:跳过 1 个事务
stop slave;
set GLOBAL SQL_SLAVE_SKIP_COUNTER=1;
start slave;

5. 主库更新记录在从库缺失

问题现象

更新主库存在、从库已删的记录,报错:Can’t find record

解决方案

  1. 解析 Relay Log 定位缺失数据:
mysqlbinlog 中继日志 --start-position=位点 --base64-output=decode-rows -v > 解析文件
  1. 从库补全记录后重启复制。

6. 主库 Binlog 被清理,位点找不到

问题现象

从库提示:Could not find first log file name

解决方案

  1. 有正常从库:直接从正常从库重建复制。
  2. 无正常从库:用 XtraBackup 备份主库,重建从库复制关系。

7. GTID 空洞问题

产生原因

手动跳过事务、主从切换、盲目配置 slave-skip-errors=all

规避建议

  • GTID 模式禁止用 SQL_SLAVE_SKIP_COUNTER
  • 主从切换前保证全量同步
  • 不全局跳过所有错误

8. 主从 UUID 重复

问题原因

服务器克隆导致 auto.cnf 文件一致,UUID 相同。

解决方案

  1. 停止从库 MySQL
  2. 删除 data/auto.cnf
  3. 重启 MySQL,自动生成新 UUID
  4. 重新建立主从关系

9. 从库会读到比主库更新的数据?

在 “一主两从” 架构(1 个异步从库 + 1 个半同步从库)中,需结合 MySQL 复制类型和两阶段提交原理分析:

前置知识

  1. 两阶段提交:InnoDB 事务提交分两步:
    • Prepare 阶段:写入 Redo Log,标记事务为 “准备提交”;
    • Commit 阶段:写入 Binlog,再将 Redo Log 标记为 “已提交”。
  2. 复制类型
    • 异步复制:主库提交事务后立即返回客户端,不等待从库同步;
    • 半同步复制(after_commit):主库执行 Commit 阶段后,等待从库确认接收 Binlog 再返回;
    • 增强半同步复制(after_sync):主库执行 Prepare 阶段后,先发送 Binlog 给从库,待从库确认后再执行 Commit 阶段。

结论

特定场景会出现:增强半同步 after_sync 模式下,从库已落盘、主库未提交,从库可读到更新数据。

规避

改为 after_commit 模式,保证一致性。

排查总思路

  1. 先看线程:IO 线程问题→网络 / 配置 / 权限;SQL 线程问题→数据冲突 / 结构不一致
  2. 查日志:show slave status\G + 系统错误日志
  3. 按复制模式(GTID / 位点)选修复方案

日常运维建议

  • 定期检查磁盘、复制延迟、GTID 完整性
  • 主库 Binlog 保留足够时长
  • 禁止手动修改从库数据
  • 半同步优先用 after_commit

以上就是MySQL主从复制故障排查及解决方案的详细内容,更多关于MySQL主从复制故障排查解决的资料请关注脚本之家其它相关文章!

相关文章

  • 美团网技术团队分享的MySQL索引及慢查询优化教程

    美团网技术团队分享的MySQL索引及慢查询优化教程

    这篇文章主要介绍了美团网技术团队分享的MySQL索引及慢查询优化教程,结合了实际的磁盘IO情况对一些优化方案作出了分析,十分推荐!需要的朋友可以参考下
    2015-11-11
  • mysql删除关联表的实操方法

    mysql删除关联表的实操方法

    在本篇内容里我们给大家整理了关于mysql删除关联表的实操方法以及相关SQL语句,需要的朋友们学习下吧。
    2019-05-05
  • MySQL建表和增添改查操作代码

    MySQL建表和增添改查操作代码

    这篇文章主要介绍了MySQL建表和增添改查操作代码,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧
    2024-03-03
  • mysql-5.5.28源码安装过程中错误总结

    mysql-5.5.28源码安装过程中错误总结

    介绍一下关于mysql-5.5.28源码安装过程中几大错误总结,希望此文章对各位同学有所帮助。
    2013-10-10
  • 详解JDBC数据库链接及相关方法的封装

    详解JDBC数据库链接及相关方法的封装

    这篇文章主要介绍了详解JDBC数据库链接及相关方法的封装的相关资料,下面是封装的具体类,用到了泛型和反射,希望能帮助到大家,需要的朋友可以参考下
    2017-08-08
  • MySQL主从同步、读写分离配置步骤

    MySQL主从同步、读写分离配置步骤

    根据要求配置MySQL主从备份、读写分离,结合网上的文档,对搭建的步骤和出现的问题以及解决的过程做了如下笔记
    2012-03-03
  • MAC下修改mysql默认字符集为utf8的方法

    MAC下修改mysql默认字符集为utf8的方法

    本文主要介绍了如何修改MAC版mysql默认字符集为utf8,如果你的MAC版mysql字符乱码,可以参考一下这篇文章
    2018-03-03
  • mysql条件下推的实现

    mysql条件下推的实现

    本文主要介绍了Java开发中SQL优化的条件下推技术,通过提前将过滤条件下推至子查询/视图执行,减少中间结果量,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2025-09-09
  • MYSQL神秘的HANDLER命令与实现方法

    MYSQL神秘的HANDLER命令与实现方法

    这篇文章主要介绍了MYSQL神秘的HANDLER命令与实现方法,需要的朋友可以参考下
    2016-07-07
  • MySQL 线上日志库迁移实例

    MySQL 线上日志库迁移实例

    这篇文章主要介绍了MySQL 线上日志库迁移实例,帮助大家更好的理解和学习使用MySQL,感兴趣的朋友可以了解下
    2021-03-03

最新评论