天天看点

索引(二)

查询过程

1,查询语句在索引树上查找过程,先通过B+树从树根开始按层搜索到叶子节点,数据页内部通过二分法定位记录。

1)对于普通索引,查找到满足条件的第一个记录后,需要查找下一个记录,直到第一个不满足条件的记录。

2)对于唯一索引,由于索引定义了唯一性,查询到第一个满足条件的记录后,就会停止搜索。

2,两种不同方式带来的性能差距比较小,InnoDB数据是按数据页为单位来读写的,当需要读一条记录时,不是将这条记录从磁盘读出,而是将这条记录的数据页整体读入内存。

1)InnoDB中,每个数据页的大小默认是16KB。

2)普通索引查找和判断下一条记录,只需要一次指针寻找和一次计算,但查找的记录刚好是数据页的最后一条记录,则取下一条记录时必须读取下一个数据页,操作稍微复杂一些。

3)对于整型字段,一个数据页可以存放近千个key,读取下一个数据页的概率比较低,所以在计算平均性能差异时忽略不计。

更新过程

1,更新语句,如果数据页在内存中直接更新,数据页不在内存中,在不影响数据一致性的前提下,InnoDB将更新缓存在change buffer中。

1)不从磁盘读入数据页,在下次查询需要访问数据页时再将数据页读入内存,然后执行change buffer中与数据页有关的操作,保证数据逻辑的正确性。

2)change buffer中的操作应用到原数据页的过程为merge,访问数据页会触发merge,系统后台线程也会定期merge,数据库正常关闭也会执行merge操作。

2,change buffer是可以持久化的数据,在内存中有拷贝,也会写入到磁盘。

1)数据读入内存需要占用buffer pool,使用change buffer可减少读磁盘,提升语句执行速度,还可避免占用内存,提高内存利用率。

2)change buffer占用的buffer pool的内存,大小可通过参数innodb_change_buffer_max_size动态设置,设置为50时,表示最多只能占buffer pool的50%。

change buffer

1,唯一索引不使用change buffer,普通索引使用。

1)唯一索引,所有的更新都要先判断索引的唯一性,例如插入数据时需要先判断表中key是否存在,则必须将数据页读入内存,没有冲突则插入数据,语句执行结束,也就没必要使用change buffer了。

2)普通索引可以使用change buffer,将更新记录在change buffer中,语句执行结束。

2,将数据从磁盘读入内存涉及随机IO的访问,是数据库中成本最高的操作之一,change buffer减少了随机磁盘的访问,对更新的性能提升比较明显。

3,merge才是真正数据更新过程,数据页merge之前,change buffer记录的变更越多,性能提升越明显。

1)在帐单类、日志类写多读少的业务中,页面写完立即访问的概率较小,change buffer使用效果佳。

2)业务更新之后立刻查询,更新记录在change buffer里,但立刻访问这个数据页触发merge过程,随机访问IO次数并不会减少,反而增加了change buffer的维护代价,可以关闭change buffer。

3)普通索引和唯一索引尽量选择普通索引,配合使用change buffer,更新优化明显。

change buffer和redo log

1,执行一条更新语句:

1)如果数据页在内存中,直接更新内存同时记录到redo log,之后执行查询操作直接从内存返回;

2)如果数据页不在内存中,将更新记录到内存change buffer区域,并记录到redo log中,之后执行查询操作,需要从磁盘读入数据页到内存,再应用change buffer操作,最后返回正确结果。

2,一条更新语句插入多个记录,按以上原则写到内存或change buffer中,写了两处内存,多条记录顺序写入redo log,写一次磁盘。

3,redo log主要节省随机写磁盘的IO消耗(转成顺序写),change buffer主要节省随机读磁盘的IO消耗。

继续阅读