天天看點

服務案例 SQL server資料庫反複重新開機

作者:LinkSLA智能運維管家

LinkSLA智能運維管家對主流資料庫的監控,能夠及時發現異常,快速響應,保障業務系統的穩定。平台通過對SQL Server資料庫監控,幫助使用者在資料庫出現異常時事件處理。

1SQL Server資料庫監控内容如下

1 、資料庫伺服器基本性能監控。包括:伺服器的CPU數量,記憶體大小,伺服器線上時間,線上資料執行個體個數,離線資料執行個體個數和挂起的資料執行個體個數。

2、監控資料庫基本統計資訊。比如實時使用者連接配接數,實時的活動臨時資料表個數,平均每秒登入的使用者數和平均每秒登出的使用者數等。

3、對資料庫鎖的監控。每秒超值鎖的個數和死鎖的個數。

4、對資料庫記憶體使用情況監控。包括資料庫運作需要的理想的記憶體和實際使用的記憶體量,以及成功擷取記憶體授權的程序數和正在等待記憶體授權的程序數量。

5、資料庫資源池配置設定,預設包括default資源和内部資源,内部資源是保證資料庫正常運作所需消耗的CPU和記憶體資源。

6、對資料庫記憶體緩沖區管理監控, 包括資料庫命中率,頁預期壽命,和每秒實體讀頁數和每秒實體寫頁數,以及每秒實體惰性寫次數。

資料命中率值不能低于 90%,頁預期壽命是資料頁在緩存中停留的時間,當資料頁在緩存中低于300S就被置換出去時,需要檢查配置設定給資料庫使用的記憶體,是否存在記憶體不足問題。

7、監控資料庫執行個體。在這裡我們可以看到SQL server中的所有資料庫執行個體,以及每個資料執行個體的資料檔案和日志檔案大小,并可以根據時序圖,對檔案大小進行趨勢預測。

8、資料庫的IO監控。包括每秒從資料庫讀取的位元組數和每秒從資料庫寫入的位元組數,這兩個參數可以反映反映了資料庫緩存和磁盤之間的IO交換的性能。

9、對SQL Server中的錯誤監控。例如DB離線錯誤,資訊錯誤和使用者錯誤等。

10、對資料庫中等待程序的統計監控。列出線程所遇到的所有等待的相關資訊。比如等待CPU資源的程序數,平均等待時間。等待記憶體資源的程序數,平均等待時間。以及等待鎖的程序數和等待網絡IO的程序數等等。對資料庫每秒錯誤數監控和等待時間監控,可以幫助我們來診斷 SQL Server 以及特定查詢和批處理的性能問題。

事件排查

10月13日,某三甲醫院新接入4台伺服器系統、4個SQL server資料庫,系統對HIS資料庫進行重點監控。

自10月15日起,LinkSLA智能運維平台監測到新接入的HIS/CIS資料庫多次發生重新開機,MOC工程師通知使用者進行檢視重新開機原因;

服務案例 SQL server資料庫反複重新開機

報告資料庫有逾時鎖超出門檻值告警。鎖等待時間是一個程序花費在等待另一個程序釋放鎖的時間。

服務案例 SQL server資料庫反複重新開機

MOC工程師及時與應用廠商的資料工程師回報,對方未發現有重新開機事件。

MOC工程師将資料庫運作時間展示給應用廠商的工程師檢視:HIS/CIS DB092172.20.64.xx資料庫運作時間是212分鐘,在6點21分時重新開機,這個參數值是資料庫的運作名額值。請檢查資料庫重新開機的原因。

通過資料庫運作時間,确認資料庫發生重新開機,提高問題關注度。

服務案例 SQL server資料庫反複重新開機

應用廠商的工程師通過登入資料庫确認,确認資料庫反複重新開機現象。

接下來的一周,資料庫仍然時常發生重新開機,每秒逾時鎖數量超出門檻值。由于系統叢集沒有異常報錯,應用廠商資料工程師并未重視。

服務案例 SQL server資料庫反複重新開機

事件處理

經過MOC工程師反複通報資料庫重新開機問題,引起使用者重視。應用廠商的資料庫工程師經過排查,發現是SQL Server資料庫bug導緻反複重新開機,對資料庫進行打更新檔更新。

打更新檔更新後,MOC工程師持續監測SQL server資料庫問題。後期未發生SQL Server資料庫反複重新開機問題,告警得以解除。

事件複盤

從HIS資料庫安裝後,發生反複自動重新開機,應用廠商的資料工程師未發現重新開機故障。接到MOC工程師告警後,應用廠商的資料工程師認為叢集沒有異常報錯,并未着急處理。但是HIS系統是醫院的核心系統,資料庫反複自動重新開機,存在很大的安全隐患。平台多次告警,鎖定SQL Server資料庫bug導緻,并進行打更新檔更新,資料庫反複重新開機問題解決。

通過這個案例可以了解到,業務系統由應用廠商安裝和維護,出現故障隐患時,使用者并不能及時感覺,更無法及時解決。LinkSLA智能運維管家幫助使用者一站式監控所有業務系統,及時發現故障MOC工程師并持續跟蹤,直至問題解決,形成服務閉環。為使用者提供省心、放心的IT運維服務,保障使用者系統健康穩定運作。

聲明:文案&圖檔為原創内容,轉載請注明。

繼續閱讀