資料庫的性能調優,需要基于作業系統的性能名額,如果作業系統級發生了一些狀況,那麼會潛移默化的影響到資料庫層面。而資料庫中對應的程序和作業系統級也有一定的映射關系,在專有伺服器模式下大體如此。
有時候如果你注意到作業系統級有一些程序消耗資源高,那麼很可能這個程序對應的資料庫程序存在潛在的問題,這種方法在平時的性能診斷調優中屢試不爽,基本能夠很快的定位出問題所在。
一方面可以通過資料庫的視圖映射來分析排查問題,但是很可能等你sql語句準備好了的時候,程序的某些任務也執行完成了,無法同步的抓取到一些很關鍵的資訊。
以下的shell腳本對作業系統級的程序和資料庫層的程序進行了映射,能夠找到對應的session,然後得到目前活最近執行的sql語句。
if [ -z "$1" ]; then
echo "no process has provided!"
exit 0
fi
sh_tmp_process=`sqlplus -silent $DB_CONN_STR@$SH_DB_SID
set pagesize 0 feedback off verify off heading on echo off
select addr from v\\$process where spid=$1;
exit;
END`
if [ -z "$sh_tmp_process" ]; then
echo "no process exists or session is not from a DB account"
echo
echo "####### Process Information from OS level as below ########"
ps -ef|grep $1|grep -v "grep"|grep ora
echo "##############################################"
else
echo '*******************************************'
echo "Process has found, pid: $1 , addr: $sh_tmp_process "
ps -ef|grep $1|grep -v grep|grep ora
sqlplus -s $DB_CONN_STR@$SH_DB_SID
col machine format a20
col terminal format a15
col osuser format a15
col process format a15
col username format a15
set linesize 150
select sid,serial#,username,osuser ,machine,process,terminal,type,to_char(LOGON_TIME,'yyyy-mm-dd hh24:mi:ss')login_time from v\$session
where paddr='$sh_tmp_process';
prompt .
col sql_id format a30
col prev_sql_id format a30
col sql_text format a60
set pages 50
select sql_id,sql_text from v\$sql where sql_id in (select sql_id from v\$session where paddr='$sh_tmp_process' and sql_id is not null ) and rownum
select sql_id prev_sql_id ,sql_text from v\$sql where sql_id in (select prev_sql_id sql_id from v\$session where paddr='$sh_tmp_process' ) and rownum
EOF
假設腳本名為showpid.sh 則運作方式如下,我們碰到了一個程序異常,pid為29291
> ksh showpid.sh 29291
*******************************************
Process has found, pid: 29291 , addr: 000000089837FF20
####### Process Information from OS level as below ########
oraccbs1 21784 31648 0 20:05 pts/3 00:00:00 ksh showpid.sh 29291
oraccbs1 29291 1 90 20:00 ? 00:04:30 oracleCUST01 (LOCAL=NO)
##############################################
SID SERIAL# USERNAME OSUSER MACHINE PROCESS TERMINAL TYPE LOGIN_TIME
---------- ---------- --------------- --------------- -------------------- --------------- --------------- ---------- -------------------
4779 10699 PRODTEST PRODOSUSER xxxxxxxxxx 4956:5500 TIT_C15-xxxx USER 2015-01-31 20:00:29
SQL_ID SQL_TEXT
------------------------------ ------------------------------------------------------------
248xkdahtdb2q
UPDATE
COMM_ACTIVITY SET COMM_ACTIVITY.EXTRACT_STATUS = NVL(:1 ,
EXTRACT_STATUS), COMM_ACTIVITY.SOURCE_TYPE = NVL(:2 , SOURCE_TYPE),
OPERATOR_ID = :3 , APPLICATION_ID = :4 , DL_SERVICE_CODE = :5 ,
DL_UPDATE_STAMP = :6 , SYS_UPDATE_DATE = SYSDATE where
COMM_ACTIVITY.ACTIVITY_CODE=:7 AND
COMM_ACTIVITY.EXTRACT_STATUS=:8
通過如上的指令能夠很快的定位到程序和session對應的sql語句,對于排查問題來說更加直覺。
現在隻需要分析一下這條語句即可,看看是什麼原因導緻資源消耗異常。
最後發現這條看似簡單的update語句走了全表掃描。其實可以進行一定的優化的。對于這條語句的分析詳情請參見http://blog.itpub.net/23718752/viewspace-1422310/