天天看點

HP伺服器ASR介紹

ASR(Automatic Server Recovery)是一個硬體部件,它能檢查一些嚴重的伺服器關鍵事件和一些重要零部件是否異常(如記憶體錯誤、磁盤故障、溫度過高、電源掉電、風扇故障、網卡異常等)。

ASR機制可以通過BIOS 設定成開或關,在開啟狀态下,如果ASR沒有檢測到軟體層的ASM驅動,那麼ASR臨時“自殘”(相當于關閉自己)。ASR是HP公司發明的一個先進的硬體故障檢測部件,目前已經內建在HP DL 380 及以上版本的機器中,HP官方強烈建議使用者開啟該功能并相應裝上ASM驅動(采用smartstart部署系統或安裝PSP包會自動安裝該驅動),否則機器可能在故障存在的情況下繼續跑應用,這時資料安全難以保障。從上圖中還可以看出ASM是“內建”在軟體層的,它在使用者空間安插一個探針hpasmd,hpasmd一個主要功能就是對ASR中計數器周期性地賦一個正數值,ASR則周期性地遞減這個計數器,如果該計數器大于0表明hpasmd還“活着”,hpasmd活着又意味着軟體層還活着,如果該計數器在10分鐘内(預設值)保值非正,那麼ASR就直接給CPU發reset信号,因為此時ASR認為作業系統被挂起了!我們可以做這個實驗:把hpasmd程序直接殺掉,一會兒機器就直接重新開機了。