天天看点

详解数仓的锁相关参数及视图

摘要:GaussDB(DWS) 中锁等待可以设置等待超时相关参数,一旦等锁的时间超过参数配置值会抛错。

本文分享自华为云社区《​​GaussDB(DWS) 锁相关参数及视图详解​​》,作者: yd_220527686。

一、锁相关参数

GaussDB(DWS) 中锁等待可以设置等待超时相关参数,一旦等锁的时间超过参数配置值会抛错。跟锁相关的参数有4个,具体含义如下:

1.deadlock_timeout

表示死锁检测时间,到达该时间后进行死锁检测,默认1秒。

2.lockwait_timeout

当出现表锁冲突的时候生效,当等待表锁的时间超过配置的时间,抛错返回,默认20分钟。

3.update_lockwait_timeout

当出现记录锁冲突的时候生效,如果等待记录锁的时间超过update_lockwait_timeout,抛错返回,默认2分钟。

4.ddl_lock_timeout

当出现八级表锁冲突的时候生效,当等待获取八级锁的时间超过配置的时间,抛错返回,默认值为0,表示不生效,需用户手动开启(在8.1.3版本及更高版本生效)。

二、锁相关参数之间的逻辑

在8.1.3版本中,新增加参数ddl_lock_timeout,其优先级高于lockwait_timeout。deadlock_timeout、lockwait_timeout和ddl_lock_timeout的逻辑关系如下:

  1. 当ddl_lock_timeout生效,且申请的锁是八级锁时,锁等待超时报错的时间为ddl_lock_timeout的值;当申请的锁不是八级锁时,锁等待超时报错的时间为lockwait_timeout的值;
  2. 如果参数lockwait_timeout > deadlock_timeout时,同时启死锁定时器和锁超时定时器。当参数lockwait_timeout <= deadlock_timeout时,只启动锁超时定时器,不启动死锁定时器。

三、构建死锁和锁超时场景示例

构建3个元素的死锁场景如下:

详解数仓的锁相关参数及视图

首先执行第一行(按照session号从小到大执行)然后执行第二行(按照session号从小到大执行),可以通过获取对应锁的SQL语句,获得锁。表锁还可以手动的使用SQL语句的方式进行强制上锁,SQL语句的格式如下所示:

LOCK TABLE [ name ] IN [ lockmode ] MODE;      

其中 lockmode 可以是以下之一:

ACCESS SHARE | ROW SHARE | ROW EXCLUSIVE | SHARE UPDATE EXCLUSIVE

| SHARE | SHARE ROW EXCLUSIVE | EXCLUSIVE | ACCESS EXCLUSIVE

要注意的是LOCK语句只能在事务块中执行,事务结束会释放。

设置deadlock_timeout、lockwait_timeout和ddl_lock_timeout的值,预期如下:

1.当ddl_lock_timeout = 0,lockwait_timeout>deadlock_timeout > 0:

2.当ddl_lock_timeout = 0,deadlock_timeout>lockwait_timeout > 0:

详解数仓的锁相关参数及视图

3.当ddl_lock_timeout != 0,ddl_lock_timeout>deadlock_timeout > 0:

详解数仓的锁相关参数及视图

4.当ddl_lock_timeout != 0,deadlock_timeout>ddl_lock_timeout > 0:

详解数仓的锁相关参数及视图

5.当ddl_lock_timeout != 0,deadlock_timeout=ddl_lock_timeout > 0:

详解数仓的锁相关参数及视图

四、锁等待查询

1. 通过查询pg_locks视图查看单个节点的锁持有和等待状态,pg_locks视图的结构如下图:

locktype | database | relation | page | tuple | virtualxid | transactionid | classid | objid | objsubid | virtualtransaction | pid |           mode           | granted | fastpath 
---------------+----------+----------+------+-------+------------+---------------+---------+-------+----------+--------------------+-----------------+--------------------------+---------+----------
 relation      | 15835 | 11835 | | | | | | | | 13/3755 | 139776366208768 | AccessShareLock | t       | t
 virtualxid | | | | | 13/3755 | | | | | 13/3755 | 139776366208768 | ExclusiveLock | t       | t
 virtualxid | | | | | 12/38 | | | | | 12/38 | 139776382990080 | ExclusiveLock | t       | t
 virtualxid | | | | | 8/263 | | | | | 8/263 | 139776720103168 | ExclusiveLock | t       | t
 virtualxid | | | | | 7/314 | | | | | 7/314 | 139776736884480 | ExclusiveLock | t       | t
 virtualxid | | | | | 5/717 | | | | | 5/717 | 139776778299136 | ExclusiveLock | t       | t
 transactionid | | | | | | 210480 | | | | 12/38 | 139776382990080 | ExclusiveLock | t       | f
 relation      | 15835 | 16980 | | | | | | | | 12/38 | 139776382990080 | ShareUpdateExclusiveLock | t       | f
 relation      | 15835 | 16980 | | | | | | | | 12/38 | 139776382990080 | ShareRowExclusiveLock | t       | f      

其中:

locktype:表示锁类型,包括表锁、事务锁、扩展锁、自定义锁等;

relation:表示表的oid,如果是表锁,relation列会显示表的oid

transactionid:表示事务号,如果是事务锁,transactionid列会显示session的事务号

mode:表示锁级别,级别1-8级;

pid:表示session的线程号;

granted:'t’表示持有锁,'f’表示等待锁;

2. 通过pgxc_lockwait_detail和pgxc_wait_detail查看锁等待状态,该方法仅适用于8.1.3及以上版本;

1、pgxc_lockwait_detail系统视图,显示每个节点中锁等待链详细信息

查询语句:

select *  from pgxc_lockwait_detail;      
详解数仓的锁相关参数及视图

其中:

level:表示等待链中的层级,以1开始,每显示一层等待关系level会加1。

lock_wait_hierarchy:表示等待链,以节点名称:进程号->几点名称:等待进程号->节点名称:等待进程号->…。

wait_for_pid:表示锁冲突线程的线程号

conflict_mode:表示锁冲突线程持有的冲突锁级别

query:表示查询语句

2、pgxc_wait_detail系统视图,显示所有节点SQL等待从上之下的等待链详细信息,包括wait_node、query等

查询语句:

select *  from pgxc_wait_detail;
level | lock_wait_hierarchy | node_name | db_name | thread_name | query_id | tid | lwtid | ptid | tlevel | smpid | wait_status | wait_event | exec_cn | wait_node |                                       query                                       | application_name | backend_start | xact_start | query_start | waiting | state
-------+---------------------------------------------------------+--------------+----------+-------------+--------------------+-----------------+-------+------+--------+-------+----------------------------------+------------+---------+--------------+-----------------------------------------------------------------------------------+------------------+-------------------------------+-------------------------------+-------------------------------+---------+--------
 1 | cn_5002:140698314475264 | cn_5002      | postgres | OM | 144959613006392061 | 140698314475264 | 21820 | | 0 | 0 | wait node(total 3): dn_6005_6006 | | t       | dn_6005_6006 | +| OM | 2022-10-08 18:02:55.810858+08 | 2022-10-08 18:03:10.478458+08 | 2022-10-08 18:02:55.819575+08 | t       | active
 | | | | | | | | | | | | | | | INSERT INTO scheduler.bandwidth_history_table +| | | | | |
 | | | | | | | | | | | | | | | SELECT timestamp, node_name, "rxpck/s", "txpck/s", "rxkB/s", "txkB/s"+| | | | | |
 | | | | | | | | | | | | | | | FROM (select '2022-10-08 18:02:55' as timestamp), PGXC_COMM_STATUS; +| | | | | |
 | | | | | | | | | | | | | | | | | | | | | 
 2 | cn_5002:140698314475264 -> dn_6005_6006:140246537033472 | dn_6005_6006 | postgres | cn_5002     | 144959613006392061 | 140246537033472 | 1587 | | 0 | 0 | none                             | | f       | | SELECT * FROM pg_comm_status; | cn_5002          | 2022-10-08 12:01:38.70103+08 | 2022-10-08 18:03:10.478458+08 | 2022-10-08 18:03:10.493286+08 | f       | active      

其中:

wait_status:当前线程的等待状态

wait_event:持有此锁或者在等待此锁的事务的虚拟id

exec_cn:是否执行sql语句的cn节点

wait_node:锁级别级别

query:查询语句

backend_start:后端进程启动时间,即客户端连接服务器的时间

xact_start:当前事务的启动时间

query_start:开始当前活跃查询的时间

waiting:是否正处于等待状态

state:后端当前总体状态

tips:为保证查询链条正确,在使用pgxc_wait_detail和pgxc_lockwait_detail时不能进行排序和分组。