MySQL · 引擎特性 · MySQL logical read-ahead

2021-11-07 06:30:32

这两种方式之所以带来了更高的吞吐量，都基于数据存储的连续性的假设，比如mysql使用自增字段作为pk的innodb索引表，或者是oracle使用默认的堆表，但当这样的假设条件不成立的时候，怎么办？

考虑下面的一个场景，如下图所示：

这是一个b-tree结构，典型的innodb的索引聚簇表，这样的结构很容易构造，比如使用一个非连续的字段作为索引字段，随机对记录进行插入，这样leaf page链表上的page_no就会产生非连续性，如果进行一次全表扫描，比如 <code>checksum table t</code>，按照正常的升序扫描，leaf page扫描的page_no顺序是3, 4, 5230等等，这样其实是无法使用到innodb 的linear read-ahead，更没有办法合并io请求。

对于存在时间比较长，变更又比较多的大表，除非我们对于这个表进行重建，否则leaf page的离散性会随着时间的推移，越来越严重。但对于在线应用来说，重建又会产生比较大的运维风险，这里就介绍一种平衡的方法，logical read-ahead。

逻辑预读的概念是指，根据branch节点来预读leaf节点。

逻辑预读使用两个扫描路径:

1. 一个cursor定位到leaf page，然后根据leaf page之间的双链表，moves_up进行扫描数据；

2. 另一个cursor定位到branch节点，因为innodb b-tree结构的每一层都由双向链表进行连接，然后这个cursor就沿着branch节点进行扫描，保存扫描到的page_no，然后使用异步io，发起这些leaf page的预读取。

mysql 5.6版本上的实现方式:

1. 在<code>row_search_for_mysql</code>进行moves_up的过程中进行logical read-ahead；

2. branch节点扫描的cursor保存到trx结构中，生命周期到一个sql语句结束；

3. branch cursor扫描用户可配置的page count，临时保存到数组中，对page_no进行排序；

4. 使用libaio发起异步io读取，完成logical read-ahead。

logical read-ahead很好的提升了离散存储数据的吞吐能力，facebook在他们的mysql实例的逻辑备份过程中，对于大表的dump备份开启了此特性，备份速度有非常大的提升。

MySQL · 引擎特性 · MySQL logical read-ahead

继续阅读

2022秋招面试总结（cpp+java+测开）百度测开一面字节后端一面虾皮后端一面虾皮后端二面

数据库之DDL操作数据库DDL操作数据库DDL操作数据表

数据库之DQL操作数据库

mysql优化（sql优化）

数据迁移方法数据迁移原则数据迁移之双写方案数据迁移之级联同步方案

redis集群数据一致性_RedisRaft为Redis集群带来强大的数据一致性

宝塔面板mysql恢复2018.1.8更新

Centos7 MySQL 5.7 安装MySQL 5.7 安装

查找入职员工时间排名倒数第三的员工所有信息

Hibernate使用Hibernate的“3个准备，7个步骤”Hibernate API简介操作实体对象对象识别

云计算面试题——mysql/存储引擎/备份

SQL语言基础：常用的数据查询语句

Ubuntu16.04安装Apache+MySQL+PHP1. 安装Apache2. 安装MySQL3. 安装PHP4. 安装phpMyAdmin

MySQL的4种隔离级别？出现问题

neo4j之cypher使用文档

mysql使用source命令导入.sql文件