MySQL如何对主从数据不一致的情况进行校验并继续同步

两台mysql,发生了种种种种，导致了两个表的数据不一致，但是同步还在正常进行，后来意识到这种问题（可能之前skip啊，或者一开始搭建的时候就是不一致的状态），该如何修复呢？

我们看可以来看下percona-toolkit这个工具是如何修复这种情况的

校验：

主库：192.168.100.8 3306

从库：192.168.100.12 3305

mysql version：mysql-5.6.30

1.master 服务器安装yum依赖包

2.安装percona-toolkit工具包

3.master与slave数据库创建以及用户授权

4.进行校验 master上执行

#-h -u -p -p -s -d 连接信息

#--nocheck-replication-filters 检测中忽略mysql 配置参数binlog_ignore_db等。

#--nocheck-binlog-format 不检测日志格式

#--replicate 指定checksum 存储的db和表，如pt.checksum

# --chunk-size， --chunk-size-limit 用于指定检测块的大小。可控性更强

# --ignore-databases/tables/column 跳出指定元素的过滤

# --lock-wait-timeout innodb 锁的超时设定，默认为1

# --max-load 设置最大并发连接数

# --replicate-check-only 只输出数据不一致的信息。

# --help

校验结果

ts ：完成检查的时间。

errors ：检查时候发生错误和警告的数量。

diffs ：0表示一致，1表示不一致。当指定--no-replicate-check时，会一直为0，当指定--replicate-check-only会显示不同的信息。

rows ：表的行数。

chunks ：被划分到表中的块的数目。

skipped ：由于错误或警告或过大，则跳过块的数目。

time ：执行的时间。

table ：被检查的表名。

注意：

要是在执行命令的过程遇到找不到从服务器的错误：

默认是通过show processlist 找到host的值或show slave hosts 找到host的值。

关于--recursion-method参数的设置有：

在从库的配置文件里加：

report_host = 192.168.200.25 #设置成本地地址

最后再执行以上命令（多加--recursion-method=hosts 参数）：

先校验出哪些库的表不同步，然后指定库与表生成语句，采用第二种方法，将生成的sql语句在从库执行即可。

5.数据同步，复制，消除差异（master服务器运行）要是有中文的则需要加上：--charset=utf8，防止乱码。

i.自动消除差异（不推荐）

ii.打印出sql语句，人工干预到slave库执行（推荐）

#--sync-to-master ：指定一个dsn，即从的ip，他会通过show processlist或show slave status 去自动的找主。

#--replicate ：指定通过pt-table-checksum得到的表，这2个工具差不多都会一直用。

#--print ：打印，但不执行命令。

#--execute ：执行命令。

7.实际解决：

由于其中一个表的数据较大，采用dump导出的方式在从库上恢复

1.第一个执行采用pt-table-sync方式恢复

2.第二个表采用导出导入的方式恢复

同步完成后再校验：

注意事项

1.采用replace into来修复主从不一致，必须保证被replace的表上有主键或唯一键，否则replace into退化成insert into，起不到修复的效果。这种情况下pt-table-sync会采用其他校验和修复算法，但是效率非常低，例如对所有列的group by然后求count(*)(表一定要有主键！)。

2.主从数据不一致需要通过replace into来修复，该sql语句必须是语句级。pt-table-sync会把它发起的所有sql语句都设置为statement格式，而不管全局的binlog_format值。这在级联a-b-c结构中，也会遇到pt-table-checksum曾经遇到的问题，引起行格式的中继库的从库卡库是必然。不过pt-table-sync默认会无限递归的对从库的binlog格式进行检查并警告。

3.由于pt-table-sync每次只能修复一个表，所以如果修复的是父表，则可能导致子表数据连带被修复，这可能会修复一个不一致而引入另一个不一致；如果表上有触发器，也可能遇到同样问题。所以在有触发器和主外键约束的情况下要慎用。pt-table-sync工具同样也不欢迎主从异构的结构。pt-table-sync工具默认会进行先决条件的检查。

4.pt-table-sync在修复过程中不能容忍从库延迟，这正好与pt-table-checksum相反。如果从库延迟太多，pt-table-sync会长期持有对chunk的for update锁，然后等待从库的master_pos_wait执行完毕或超时。从库延迟越大，等待过程就越长，主库加锁的时间就越长，对线上影响就越大。因此要严格设置max-lag。

5.对从库数据的修复通常是在主库执行sql来同步到从库。因此，在有多个从库时，修复某个从库的数据实际会把修复语句同步到所有从库。数据修复的代价取决于从库与主库不一致的程度，如果某从库数据与主库非常不一致，举例说，这个从库只有表结构，那么需要把主库的所有数据重新灌一遍，然后通过binlog同步，同时会传递到所有从库。这会给线上带来很大压力，甚至拖垮集群。正确的做法是，先用pt-table-checksum校验一遍，确定不一致的程度：如果不同步的很少，用pt-table-sync直接修复；否则，用备份先替换它，然后用pt-table-sync修复。说明：这实际提供了一种对myisam备份的思路：如果仅有一个myisam的主库，要为其增加从库，则可以：先mysqldump出表结构到从库上，然后启动同步，然后用pt-table-sync来修复数据。

MySQL如何对主从数据不一致的情况进行校验并继续同步

继续阅读

SQL优化SQL语句优化的目的

数据迁移方法数据迁移原则数据迁移之双写方案数据迁移之级联同步方案

redis集群数据一致性_RedisRaft为Redis集群带来强大的数据一致性

JAVA高效编程指南

宝塔面板mysql恢复2018.1.8更新

Centos7 MySQL 5.7 安装MySQL 5.7 安装

查找入职员工时间排名倒数第三的员工所有信息

Hibernate使用Hibernate的“3个准备，7个步骤”Hibernate API简介操作实体对象对象识别

云计算面试题——mysql/存储引擎/备份

关于SQL语言

SQL语言基础：常用的数据查询语句

Ubuntu16.04安装Apache+MySQL+PHP1. 安装Apache2. 安装MySQL3. 安装PHP4. 安装phpMyAdmin

MySQL的4种隔离级别？出现问题

neo4j之cypher使用文档

mysql使用source命令导入.sql文件

sqlServer根据经纬查距离