天天看點

在SCOM中為Windows Service建立自動恢複任務

  最近客戶的環境中偶爾有伺服器的系統服務出現自動停止的情況,雖然說SCOM能夠監控到服務停止并發出報警,但是還得系統管理者登入伺服器手動将服務啟動,如果系統管理者不在場或者非工作時間發生問題,這就可能會造成服務長時間不可用的情況。由于服務的意外停止是不可預知的,為了確定服務異常時能夠盡快恢複,避免影響到應用服務,小弟我又研究了一下SCOM的Recovery task,通過它可以實作服務的自動啟動,當監控器監測到服務處于停止狀态時,Recovery Task會自動将該服務開啟。這麼一來,我們的系統管理者就能夠從中解脫出來,不用時刻盯着報警,發生服務停止時,Recovery task會幫助我們處理,節省時間的同時還提高了故障的處理響應速度。

          說了這麼多,下面還是詳細介紹一下在SCOM中如何去建立自動恢複任務,讓大家有一個清晰的了解,當環境中出現類似問題時也可以借助這種方法進行故障的自動處理。

首先,我們需要建立一個monitor,以便可以監控到服務的運作狀态。在Scom Console中,點選Authoring,定位到如下圖位置,然後滑鼠右擊Monitors,選擇Create a Monitor,Unit Monitor:

<a href="http://yejunjian.blog.51cto.com/attachment/201112/12/718462_13236968621tGK.jpg"></a>

在彈出的Create a unit monitor視窗中選擇一個監控器的類型,在此我們選擇Basic Service Monitor,接着為Monitor選擇存放管理包的位置,然後單擊下一步,如下圖所示:

<a href="http://yejunjian.blog.51cto.com/attachment/201112/12/718462_1323696864wgoz.jpg"></a>

在General Properties視窗中為Monitor指定一個名稱,然後選擇Monitor需要監控的目标類型,在此選擇Windows Server Operating System,然後單擊下一步,如下圖所示:

<a href="http://yejunjian.blog.51cto.com/attachment/201112/12/718462_1323696865v5Ey.jpg"></a>

在Service Details視窗中選擇需要監控的服務名稱,如下圖所示:

<a href="http://yejunjian.blog.51cto.com/attachment/201112/12/718462_1323696867Q4AR.jpg"></a>

在Configure Health視窗中單擊下一步,如下圖所示:

<a href="http://yejunjian.blog.51cto.com/attachment/201112/12/718462_1323696870vegA.jpg"></a>

在Configure Alerts視窗中根據實際需求配置是否産生報警,然後單擊Create按鈕,如下圖所示:

<a href="http://yejunjian.blog.51cto.com/attachment/201112/12/718462_13236968724Ni2.jpg"></a>

經過前面的操作後,監控器已經建立完成,下面我們還需要為監控器建立一個Recovery Task,隻有建立完Recovery Task後,SCOM才會将出問題的服務進行自動開啟。

在Authoring視窗中找到剛才建立好的Monitor,輕按兩下它打開屬性視窗,切換到Diagnostic and Recovery頁面,在視窗下方的Configure recovery tasks中選擇Add,Recovery for critical health state,如下圖所示:

<a href="http://yejunjian.blog.51cto.com/attachment/201112/12/718462_1323696876JU4W.jpg"></a>

在Select Recovery task type視窗選擇Run Command,然後單擊下一步,如下圖所示:

<a href="http://yejunjian.blog.51cto.com/attachment/201112/12/718462_1323696878lrud.jpg"></a>

在Recovery Task Name and Description視窗中為Recovery Task指定一個名稱,進行如下圖配置後單擊下一步:

<a href="http://yejunjian.blog.51cto.com/attachment/201112/12/718462_1323696879ff2U.jpg"></a>

在Configure Command Line Execution Settings視窗進行如下配置後單擊Create按鈕,至此,Recovery Task的建立操作已經完成。

<a href="http://yejunjian.blog.51cto.com/attachment/201112/12/718462_1323696883LaOr.jpg"></a>

<a href="http://yejunjian.blog.51cto.com/attachment/201112/12/718462_1323696887LkKL.png"></a>

驗證方法:

找一台安裝了Scom Agent的伺服器,将Server服務手動停止,觀察一會看服務能否自動開啟,如能正常啟動,說明Recovery Task已經可以正常工作。

本文轉自葉俊堅51CTO部落格,原文連結:http://blog.51cto.com/yejunjian/740259 ,如需轉載請自行聯系原作

繼續閱讀