天天看點

netbackup日常維護

作者:素某某

Netbackup體系結構

netbackup日常維護

Veritas netbackup由master server、media server和client用戶端三部分組成,最終可以将需要備份的資料寫入到硬碟或錄音帶,以實作備份功能。

Netbackup備份方式:

傳統的網絡備份

Netbackup lan free備份(san備份)

Netbackup server free備份

目前使用較多的備份方式為lan-free(san備份)備份方式,如圖:

netbackup日常維護

Nbu維護指令

通過圖形界面進行維護

通過圖形界面可以直覺的對nbu的備份情況進行檢查

啟動圖形界面:/usr/openv/netbackup/bin/jnbSA &

netbackup日常維護

通過字元界面維護

通過bpadm指令可以簡單對nbu備份的結果、備份日志進行檢查維護。

錄音帶立即過期:

nbumaster:~ # /usr/openv/netbackup/bin/admincmd/bpexpdate -m media_id -d 0

檢視所有錄音帶使用情況,條形碼為media id:

nbumaster:~ # /usr/openv/netbackup/bin/goodies/available_media

檢視錄音帶媒體是否正常:

nbumaster:~ # /usr/openv/netbackup/bin/admincmd/bpmedialist

檢視驅動器的狀态,是否處于正常的TLD狀态還是ACTIVE,或者不正常的AVR狀态:

nbumaster:~ # /usr/openv/volmgr/bin/vmoprcmd

檢視驅動器是否需要清洗:

nbumaster:~ # /usr/openv/volmgr/bin/tpclean –L

掃描本機所有的機械手和驅動器:

nbumaster:~ #/usr/openv/volmgr/bin/scan

檢視錄音帶驅動器及robot(機械手)細節情況:

nbumaster:~ # /usr/openv/volmgr/bin/tpconfig -d 亦可使用tpconfig -dl或tpconfig -l,顯示的資訊是不一樣的

重新開機exchanged程序:

/opt/VRTSpbx/bin/vxpbx_exchanged restart

檢查NBU程序狀态:

需要每天監控activity monitor,确認在備份伺服器上運作的程序有:avrd、vmd、tldd、ltid、bprd、nbdbd、bpdbm、bpsched、bpjobd。

如果前四個程序avrd、vmd、tldd、ltid有一個沒有運作,則備份系統工作不正常。

簡單的處理方法:重新啟動NBU伺服器程序

方法如下:

a)退出NBU的java管理界面,以root身份在指令行狀态下輸入:netbackup stop

b)使用bpps –a檢查上述程序的狀态

c)如果程序沒有被kill幹淨,繼續執行netbackup stop指令。

d)如果無法結束所有的程序,需要使用bp.kill_all來進行終結。

e)當使用bpps –a看到沒有NBU的程序輸出時,表明所有的NBU程序已經結束。使用指令:netbackup start啟動NBU程序,并用bpps –x确認。

Freeze錄音帶

bpmedia –freeze –m media_id –h media_server_hostname

bpmedia -h hostname |grep FROZEN

bpmedia –unfreeze –m a00001來使錄音帶解除當機狀态

備份作業檢查

bpdbjobs -summary -U

NBU配置檢查

bpgetconfig -L

供緊急恢複時的備份鏡像儲存資訊

bpimagelist -U

bpimagelist 使用指定的格式來報告與從指令選項發送的屬性相比對的目錄庫映像或可移動媒體;

注:-policy -st來檢查關鍵資料的全備和增量鏡像所在媒體号

SAN環境下檢查所有Media Server健康狀态

root@bimse-nbu # vmdareq -display

檢查所有政策定義

bppllist -allpolicies -U

檢查存儲單元配置

bpstulist -U -show_available

卷池資訊一緻性檢查

vmpool –listall

清理netbackup日志:

vxlogmgr -d

排錯方法

通過備份日志,定位備份失敗的錯誤代碼,通過錯誤代碼表定位故障原因。

NetBackup備份/恢複失敗是由通訊故障引起的,而不是NetBackup自身的問題。而且在處理這些故障時,使用者往往忽略通訊問題的可能。這是因為一般的應用系統在安裝NetBackup之前已經有業務系統(如,Oracle)在正常運作;使用者一般會進行簡單的名字解析配置, 并使用ping 指令驗證通過。但事實上,上述這些并不能完全保證NetBackup備份/恢複任務 正常運作, 因為:

· NetBackup程序流較一般應用程式更為複雜,要求精心規劃和實施名字解析、端口使用及防火牆政策。

· 備份應用會産生海量猝發網絡流量,要求更為健壯的網絡環境。

常見故障:

備份任務挂起

媒體錄音帶故障,可通過格式化錄音帶進行檢查

常見的通訊問題引起的NetBackup錯誤代碼有:23、24、25、40、41、42等。

23 socket read failed

24 socket write failed

25 cannot connect on socket

40 network connection broken

41 network connection timed out

42 network read failed

繼續閱讀