一、什么是binlog
binlog
其实在日常的开发中是听得很多的,因为很多时候数据的更新就依赖着
binlog
。
举个很简单的例子:我们的数据是保存在数据库里边的嘛,现在我们对某个商品的某个字段的内容改了(数据库变更),而用户检索的出来数据是走搜索引擎的。为了让用户能搜到最新的数据,我们需要把引擎的数据也改掉。
一句话:数据库的变更,搜索引擎的数据也需要变更。
于是,我们就会监听
binlog
的变更,如果
binlog
有变更了,那我们就需要将变更写到对应的数据源。
什么是 binlog
?
binlog
记录了数据库表结构和表数据变更,比如
update/delete/insert/truncate/create
。它不会记录
select
(因为这没有对表没有进行变更)
binlog
长什么样?
binlog
我们可以简单理解为:存储着每条变更的
SQL
语句(当然从下面的图看来看,不止SQL,还有XID「事务Id」等等)
binlog
一般用来做什么
主要有两个作用:复制和恢复数据
- MySQL在公司使用的时候往往都是一主多从结构的,从服务器需要与主服务器的数据保持一致,这就是通过
来实现的binlog
- 数据库的数据被干掉了,我们可以通过
来对数据进行恢复。binlog
因为
binlog
记录了数据库表的变更,所以我们可以用
binlog
进行复制(主从复制)和恢复数据。
二、什么是redo log
假设我们有一条sql语句:
update user_table set name='java3y' where id = '3'
MySQL执行这条SQL语句,肯定是先把
id=3
的这条记录查出来,然后将
name
字段给改掉。这没问题吧?
实际上Mysql的基本存储结构是页(记录都存在页里边),所以MySQL是先把这条记录所在的页找到,然后把该页加载到内存中,将对应记录进行修改。
现在就可能存在一个问题:如果在内存中把数据改了,还没来得及落磁盘,而此时的数据库挂了怎么办?显然这次更改就丢了。
如果每个请求都需要将数据立马落磁盘之后,那速度会很慢,MySQL可能也顶不住。所以MySQL是怎么做的呢?
MySQL引入了
redo log
,内存写完了,然后会写一份
redo log
,这份
redo log
记载着这次在某个页上做了什么修改。
其实写
redo log
的时候,也会有
buffer
,是先写
buffer
,再真正落到磁盘中的。至于从
buffer
什么时候落磁盘,会有配置供我们配置。
写
redo log
也是需要写磁盘的,但它的好处就是
顺序IO
(我们都知道顺序IO比随机IO快非常多)。
所以,
redo log
的存在为了:当我们修改的时候,写完内存了,但数据还没真正写到磁盘的时候。此时我们的数据库挂了,我们可以根据
redo log
来对数据进行恢复。因为
redo log
是顺序IO,所以写入的速度很快,并且
redo log
记载的是物理变化(xxxx页做了xxx修改),文件的体积很小,恢复速度很快。
三、binlog和redo log
看到这里,你可能会想:
binlog
和
redo log
这俩也太像了吧,都是用作”恢复“的。
其实他俩除了"恢复"这块是相似的,很多都不一样,下面看我列一下。
存储的内容
binlog
记载的是
update/delete/insert
这样的SQL语句,而
redo log
记载的是物理修改的内容(xxxx页修改了xxx)。
所以在搜索资料的时候会有这样的说法:
redo log
记录的是数据的物理变化,
binlog
记录的是数据的逻辑变化
功能
redo log
的作用是为持久化而生的。写完内存,如果数据库挂了,那我们可以通过
redo log
来恢复内存还没来得及刷到磁盘的数据,将
redo log
加载到内存里边,那内存就能恢复到挂掉之前的数据了。
binlog
的作用是复制和恢复而生的。
- 主从服务器需要保持数据的一致性,通过
来同步数据。binlog
- 如果整个数据库的数据都被删除了,
存储着所有的数据变更情况,那么可以通过binlog
来对数据进行恢复。binlog
又看到这里,你会想:”如果整个数据库的数据都被删除了,那我可以用
redo log
的记录来恢复吗?“不能
因为功能的不同,
redo log
存储的是物理数据的变更,如果我们内存的数据已经刷到了磁盘了,那
redo log
的数据就无效了。所以
redo log
不会存储着历史所有数据的变更,文件的内容会被覆盖的。
binlog和redo log 写入的细节
redo log
是MySQL的InnoDB引擎所产生的。
binlog
无论MySQL用什么引擎,都会有的。
InnoDB是有事务的,事务的四大特性之一:持久性就是靠
redo log
来实现的(如果写入内存成功,但数据还没真正刷到磁盘,如果此时的数据库挂了,我们可以靠
redo log
来恢复内存的数据,这就实现了持久性)。
上面也提到,在修改的数据的时候,
binlog
会记载着变更的类容,
redo log
也会记载着变更的内容。(只不过一个存储的是物理变化,一个存储的是逻辑变化)。那他们的写入顺序是什么样的呢?
redo log
事务开始的时候,就开始记录每次的变更信息,而
binlog
是在事务提交的时候才记录。
于是新有的问题又出现了:我写其中的某一个
log
,失败了,那会怎么办?现在我们的前提是先写
redo log
,再写
binlog
,我们来看看:
- 如果写
失败了,那我们就认为这次事务有问题,回滚,不再写redo log
。binlog
- 如果写
成功了,写redo log
,写binlog
写一半了,但失败了怎么办?我们还是会对这次的事务回滚,将无效的binlog
给删除(因为binlog
会影响从库的数据,所以需要做删除操作)binlog
- 如果写
和redo log
都成功了,那这次算是事务才会真正成功。binlog
简单来说:MySQL需要保证
redo log
和
binlog
的数据是一致的,如果不一致,那就乱套了。
- 如果
写失败了,而redo log
写成功了。那假设内存的数据还没来得及落磁盘,机器就挂掉了。那主从服务器的数据就不一致了。(从服务器通过binlog
得到最新的数据,而主服务器由于binlog
没有记载,没法恢复数据)redo log
- 如果
写成功了,而redo log
写失败了。那从服务器就拿不到最新的数据了。binlog
MySQL通过两阶段提交来保证
redo log
和
binlog
的数据是一致的。
过程:
- 阶段1:InnoDB
写盘,InnoDB 事务进入 redo log
状态prepare
- 阶段2:
写盘,InooDB 事务进入 binlog
状态commit
- 每个事务
的末尾,会记录一个 binlog
,标志着事务是否提交成功,也就是说,恢复过程中,XID event
最后一个 XID event 之后的内容都应该被 purge。binlog
四、什么是undo log
undo log
有什么用?
undo log
主要有两个作用:回滚和多版本控制(MVCC)
在数据修改的时候,不仅记录了
redo log
,还记录
undo log
,如果因为某些原因导致事务失败或回滚了,可以用
undo log
进行回滚