MySQL · 引擎特性 · InnoDB Adaptive hash index介绍

我们知道innodb的索引组织结构为btree。通常情况下，我们需要根据查询条件，从根节点开始寻路到叶子节点，找到满足条件的记录。为了减少寻路开销，innodb本身做了几点优化。

首先，对于连续记录扫描，innodb在满足比较严格的条件时采用row cache的方式连续读取8条记录（并将记录格式转换成mysql format），存储在线程私有的row_prebuilt_t::fetch_cache中；这样一次寻路就可以获取多条记录，在server层处理完一条记录后，可以直接从cache中取数据而无需再次寻路，直到cache中数据取完，再进行下一轮。

另一种方式是，当一次进入innodb层获得数据后，在返回server层前，当前在btree上的cursor会被暂时存储到row_prebuilt_t::pcur中，当再次返回innodb层捞数据时，如果对应的block没有发生任何修改，则可以继续沿用之前存储的cursor，无需重新定位。

上面这两种方式都是为了减少了重新寻路的次数，而对于一次寻路的开销，则使用adaptive hash index来解决。ahi是一个内存结构，严格来说不是传统意义上的索引，可以把它理解为建立在btree索引上的“索引”。

本文代码分析基于mysql 5.7.7-rc，描述的逻辑适用于5.7.7之前及5.6版本。但在即将发布的mysql-5.7.8版本中， innodb根据索引id对ahi进行了分区处理，以此来降低btr_search_latch读写锁竞争，由于尚未发布，本文暂不覆盖相关内容。

我们以一个干净启动的实例作为起点，分析下如何进行ahi构建的过程。

ahi在内存中表现就是一个普通的哈希表对象，存储在<code>btr_search_sys_t::hash_index</code>中，对ahi的查删改操作都是通过一个全局读写锁<code>btr_search_latch</code>来保护。

在实例启动，完成buffer pool初始化后，会初始化ahi子系统相关对象，并分配ahi内存，大小为buffer pool的1/64。

参考函数：<code>btr_search_sys_create</code>

tips：由于mysql 5.7已经开始支持innodb buffer pool的动态调整，其策略是buffer pool的大小改变超过1倍，就重新分配ahi hash内存（<code>btr_search_sys_resize</code>）

在系统刚启动时，索引对象上没有足够的信息来启发是否适合进行ahi缓存，因此开始有个信息搜集的阶段，在索引对象上维护了<code>dict_index_t::search_info</code>，类型为<code>btr_search_t</code>，用于跟踪当前索引使用ahi的关键信息。

在第一次执行sql时，需要从btree的root节点开始，当寻址到匹配的叶子节点时，会走如下逻辑：

btr_cur_search_to_nth_level：

这里脏读ahi开关，并判断<code>index->diable_ahi</code>是否为false。第二个条件是mysql5.7对临时表的优化，避免临时表操作对全局对象的影响，针对临时表不做ahi构建。

我们看看函数btr_search_info_update的逻辑：

对<code>info->hash_analysis++</code>，当<code>info->hash_analysis</code>值超过<code>btr_search_hash_analysis</code>（17）时，也就是说对该索引寻路到叶子节点17次后，才会去做ahi分析（进入步骤b）

进入函数<code>btr_search_info_update_slow</code>

在连续执行17次对相同索引的操作后，满足<code>info->hash_analysis</code>大于等于<code>btr_search_hash_analysis</code>的条件，就会调用函数<code>btr_search_info_update_slow</code>来更新search_info，这主要是为了避免频繁的索引查询分析产生的过多cpu开销。

innodb通过索引条件构建一个可用于查询的tuple，而ahi需要根据tuple定位到叶子节点上记录的位置，既然ahi是构建在btree索引上的索引，它的键值就是通过索引的前n列的值计算的来，所有的信息搜集统计都是为了确定一个合适的"Ｎ" ，这个值也是个动态的值，会跟随应用的负载自适应调整并触发block上的ahi重构建。

<code>btr_search_info_update_slow</code>包含三个部分：更新索引查询信息、block上的查询信息以及为当前block构建ahi，下面几小节分别介绍。

参考函数：<code>btr_search_info_update_hash</code>

这里涉及到的几个search_info变量包括：

<code>btr_search_t::n_hash_potential</code> 表示如果使用ahi构建索引，潜在的可能成功的次数

<code>btr_search_t::hash_analysis</code> 若设置了新的建议前缀索引模式，则重置为0，随后的17次查询分析可以忽略更新search_info

下面两个字段表示推荐的前缀索引模式

<code>btr_search_t::n_fields</code> 推荐构建ahi的索引列数

<code>btr_search_t::left_side</code> 表示是否在相同索引前缀的最左索引记录构建ahi；值为true时，则对于相同前缀索引的记录，只存储最右的那个记录。

通过n_fields和left_side可以指导选择哪些列作为索引前缀来构建（fold, rec）哈希记录。如果用户的sql的索引前缀列的个数大于等于构建ahi时的前缀索引，就可以用上ahi。

tips：在５.7之前的版本中，还支持索引中的字符串前缀作为构建ahi的键值的一部分，但上游认为带来的好处并不明显，因此将btr_search_t::n_bytes 移除了。(参见commit 6f5f19b338543277a108a97710de8dd59b9dbb60, 42499d9394bf103a27d63cd38b0c3c6bd738a7c7）

tips2：然而上游在测试中发现，如果把n_bytes移除，可能在诸如顺序插入这样的场景存在性能退化*(参阅commit 00ec81a9efc1108376813f15935b52c451a268cf)，因此在mysql5.7.8版本中又重新引入，本文分析代码时统一基于mysql5.7.7版本。

两种情况需要构建建议的前缀索引列：

第一种. 当前是第一次为该索引做ahi分析，btr_search_t::n_hash_potential值为0，需要构建建议的前缀索引列；

第二种. 新的记录匹配模式发生了变化(info->left_side == (info->n_fields <= cursor->low_match))，需要重新设置前缀索引列。

MySQL · 引擎特性 · InnoDB Adaptive hash index介绍

继续阅读

转详解C#数据库存取图片三大方式

BMP文件结构及图像每行字节计算方法

磁盘结构及在Linux中的命名

mysql优化（sql优化）

数据迁移方法数据迁移原则数据迁移之双写方案数据迁移之级联同步方案

redis集群数据一致性_RedisRaft为Redis集群带来强大的数据一致性

宝塔面板mysql恢复2018.1.8更新

Centos7 MySQL 5.7 安装MySQL 5.7 安装

查找入职员工时间排名倒数第三的员工所有信息

Hibernate使用Hibernate的“3个准备，7个步骤”Hibernate API简介操作实体对象对象识别

云计算面试题——mysql/存储引擎/备份

SQL语言基础：常用的数据查询语句

Ubuntu16.04安装Apache+MySQL+PHP1. 安装Apache2. 安装MySQL3. 安装PHP4. 安装phpMyAdmin

MySQL的4种隔离级别？出现问题

neo4j之cypher使用文档

mysql使用source命令导入.sql文件