本節書摘來華章計算機《vsphere性能設計:性能密集場景下cpu、記憶體、存儲及網絡的最佳設計實踐》一書中的第3章 ,第3.1.2節,[美] 克裡斯托弗·庫塞克(christopher kusek) 著 呂南德特·施皮斯(rynardt spies)姚海鵬 劉韻潔 譯, 更多章節内容可以通路雲栖社群華章計算機”公衆号檢視。
沒有管理者會百分百确定地說:“我們部署了主機入侵防禦系統(hips),并在周二打了最新的更新檔,一切都工作得很好。”而測試實驗室可以讓你更加有信心地說出這句話。從表面上看,你可能會覺得測試實驗室是測試安裝新應用程式或更新檔的,但是實際上,根據你所建立的實驗室的精确程度,它的作用遠不止于此。我們需要重點強調生産環境與測試實驗室環境相同。這将使你可以對一些非常容易忽略但又非常重要的基礎設施應用更新檔:
存儲陣列和新的更新檔程式或新版本代碼;
光纖通道或fcoe交換機更新;
網絡交換機、作業系統的更新和修丁;
伺服器固件、esxi更新和安全更新檔;
光纖通道、硬體iscsi和cna固件。
我們已經記不清有多少次因為在投入生産前沒有在測試實驗室中測試一些微小的變化而導緻系統停機,進而造成連續多日嚴重的系統中斷。在生産之前進行測試并打上相應的更新檔會很有幫助。無論它們是實體設施還是應用級的更新檔,你都會有一個參考點,然後通過适當的試運作,讓你可以放心地将它們投入生産之中。
但對于新應用的測試和部署會怎樣呢?難道我們能隻是因為它們可能會正常運作就把這些直接投入生産中嗎?曆史已經證明,“可能”往往會導緻嚴重的事件發生,是以你最好小心謹慎,在部署前進行測試。我們之前提到hips,如果不經測試和檢查,它将會是一個十足的破壞程式。其他類似的應用程式可能是一些新的管理、監控和第三方工具,如果你不知道它們會有什麼影響,那麼你絕不應該把它們投入生産中。
有些工具會直接與vmkernel進行互動,在esxi shells中運作代碼甚至其他功能。測試它能否被正常地使用、安裝、删除等,這将為你之後的工作節省大量的時間。尤其你不想向管理者解釋:環境崩潰是由部署到生産環境中一個未檢查和未測試的應用程式造成的。