PostgreSQL的表膨胀及对策 PostgreSQL的表膨胀及对策

2017-08-14 23:50:00

PostgreSQL的MVCC机制在数据更新时会产生dead元组，这些dead元组通过后台的autovacuum进程清理。一般情况下autovacuum可以工作的不错，但以下情况下，dead元组可能会不断堆积，形成表膨胀(包括索引膨胀)。

autovacuum清理速度赶不上dead元组产生速度

由于以下因素导致dead元组无法被回收

主库或备库存在长事务

主库或备库存在未处理的未决事务

主库或备库存在断开的复制槽

方法1：查询pg_stat_all_tables系统表

方法2:使用pg_bloat_check工具

以上方法包含了对索引膨胀的检查。但需要注意的是，表中不能被回收的dead tuple在索引页里是作为正常tuple而不是dead tuple记录的。考虑到这一点，索引的实际膨胀要乘以对应表的膨胀率。

调整autovacuum相关参数，加快垃圾回收速度

对于写入频繁的系统，默认的autovacuum_vacuum_cost_limit参数值可能过小，尤其在SSD机器上，可以适当调大。

监视并处理以下可能导致dead元组无法被回收的状况

长事务

未决事务

断开的复制槽

强制回收

设置old_snapshot_threshold参数，强制删除为过老的事务快照保留的dead元组。这会导致长事务读取已被删除tuple时出错。

old_snapshot_threshold不会影响更新事务和隔离级别为RR只读事务。old_snapshot_threshold参数也不能在线修改，如果已经设置了old_snapshot_threshold但又需要运行更长的RR只读事务或单个大的只读SQL，可以临时在备机上设置max_standby_streaming_delay = -1，然后在备机执行长事务(会带来主备延迟)。

杀死长事务

设置可以部分避免长事务的参数

PostgreSQL的表膨胀及对策 PostgreSQL的表膨胀及对策

继续阅读

MySQL - order by排序优化

C#连接postgresql数据库

2021-08-08 mysql索引

关于 java 转码 GBK -> UTF-8

postgresql替换换行符

查询数据库中存在的回车换行符

Django入门：第一个Django应用

SQLServer 提升查询速度

postgresql 关于GBK和utf-8字符集问题

详解SQL中几种常用的表连接方式

oracle 中不使用已有的索引解决办法

十四、MySQL备份和恢复数据库1、备份和恢复的方法2、使用mysqldump导出3、恢复转储文件4、字符编码问题5、锁表系列结语

对first_name创建唯一索引uniq_idx_firstname问题描述Sql语句

记一次因MySQL编码问题导致的慢查询排查

PostgreSQL t_bits计算方法

为什么要选择UniDAC