如何追溯 PostgreSQL 慢查詢當時的狀态

2021-11-06 18:32:40

資料庫出現慢查詢的原因很多，例如io等待，cpu繁忙，執行計劃異常，鎖等待，等等。

那麼在發生慢查詢後，如何能追溯慢查詢當時的狀态呢？

下面給大家提供一種思路，

.1. 首先，我們是如何監測慢查詢的

.2. 監測到慢查詢後，需要采集哪些資訊

.3. 資料庫核心層面能做什麼

.4. 如何分析

如何實作？

.1. 如何監測慢查詢

其中 now()-xact_start 是指事務截至目前已運作時間。

now() - query_start query截至目前已運作時間。

pid 指服務端程序id。

.2. 采集哪些資訊

如果發現運作時間超過設定門檻值，記錄該程序的以下資訊：

.2.1.

針對pid檢視它的pstack, 采集間隔自己定，比如1秒，直到對應的pid運作結束。

.2.2.

鎖等待記錄，采集間隔自己定，比如1秒，直到對應的pid運作結束。

.2.3.

整機 io 情況, 例如 iostat -x 1 ，采集間隔自己定，比如1秒，直到對應的pid運作結束。

程序io情況, iotop -p $pid ，采集間隔自己定，比如1秒，直到對應的pid運作結束。

.2.4.

網絡情況，例如sar -n dev 1 1 ，采集間隔自己定，比如1秒，直到對應的pid運作結束。

程序網絡情況，例如 iptraf，根據用戶端ip和端口号，采集間隔自己定，比如1秒，直到對應的pid運作結束。

.2.5.

cpu 使用情況

top -p $pid ，采集間隔自己定，比如1秒，直到對應的pid運作結束。

.3.1. 對執行時間超過門檻值的sql，自動記錄sql的explain 輸出，以及每個node的耗時。

配置auto_explain來實作以上目的，配置例子：

<a href="http://blog.163.com/digoal@126/blog/static/16387704020115825612145/">http://blog.163.com/digoal@126/blog/static/16387704020115825612145/</a>

.3.2. 自動記錄sql的鎖等待耗時。

配置例子：

.3.3. 核心還可以記錄sql io的時間，需要開啟io timing trace.

.3.4. pg核心目前輸出的sql時間包含了資料傳輸到用戶端的時間，但是網絡傳輸的時間沒有單獨統計，是以這個可以通過hack核心來實作。

有了以上資訊，就可以追溯慢查詢到底慢在什麼地方了。

如何追溯 PostgreSQL 慢查詢當時的狀态

繼續閱讀

set define off關閉替代變量功能

報錯：'mysql' 不是内部或外部指令，也不是可運作的程式或批處理檔案。

Linxu常用指令技巧彙總

ERROR 1 (HY000): Can't create/write to file '/tmp/#sql_4188_1.MYI' (Errcode: 28)

艱難安裝LDAP,SSL認證

《Linux指令行與Shell腳本程式設計大全第2版.布盧姆》pdf

MySQL的4種隔離級别？出現問題

XX系統實施過程問題總結

無元件上傳圖檔到資料庫中，最完整解決方案

【MySQL資料庫】資料庫索引事務1.索引2.事務

neo4j之cypher使用文檔

NOSQL安全攻擊

mybatis_入門程式Mybatis入門

登入plsql 報錯 the account is locked --使用者被鎖

sqlServer根據經緯查距離

SequoiaDB巨杉資料庫C++驅動概述