天天看點

監測系統是資料中心的一面鏡子

監控功能是資料中心的重要組成部分,通過監控系統可以對資料中心整體運作情況有全面的了解,并進行有效控制與管理。雖然無人值守資料中心、軟體定義資料中心等新的概念湧現出來,但隻是将控制權交給了機器,系統中依然需要對資料中心監控,采集各種運作參數,提供給控制中心,是以監控系統要完成資料采集、分析處理、存儲、展示、使使用者能實時掌握資料中心的基礎設施運作情況。由于資料中心自身大規模高動态的特點,監測資料中心收集也面臨着一些挑戰,要不斷豐富監測手段,采集到能夠真實反映資料中心運作狀态的資料,而不是擷取假象。

資料中心要做好監測,需要具備三個特性:實時性,資料中心監測資料應當被實時地收集到,以便于資料中心及時地控制管理,這個實時性包括周期性輪詢采集資料的時間,這個輪詢周期越短實時性越高,周期越短,單次采集的資料不宜過大,還有部分資料是靠各種運作裝置實時上報。可擴充性,在整個生命周期中,資料中心不可能一成不變,而且随着業務量的擴大,也有不斷擴容的需求。監測資料收集系統應該友善調整,為現有的或是增加的新裝置添加新的監測名額,根據資料中心變化,不斷調整監測系統,不要讓監測系統成為了擺設。智能性,監測系統不是采集完資料就了事,要具備資料分析能力,還要将采集的無效資料過濾掉,利用大樹法則獲得最有效的資料。比如采集機櫃環境溫度,在一個機房裡會有成百個機櫃,每個機櫃溫度不可能相同,有的差别甚至很大,這時就不能以點蓋面,需要多采集不同機櫃溫度,同時反複多次采集,根據采集的資料再增加一些權重算法,進而計算得出合理資料。

資料中心内部各種系統很多,這也使得監測系統非常龐大,監測系統的設計異常複雜。以一個普通資料中心的監測系統來說,要包括供配電監控、環境空調監控、安防監控、運作資料監控、屏顯中心、管理監控等等,可靠性越高的資料中心,監測系統越完善,監測的項目非常繁多。在表1裡,列舉了供配電監控的部分内容。

監測系統是資料中心的一面鏡子

通過對供配電的監控,及時了解資料中心供電系統的運作情況,一旦市電發生斷電,可以及時切換到蓄電池或者備用發電機組上,避免業務長時間中斷。也可以将監測資料發到運作資料中心,由運維人員根據資料進行工作部署。在表2裡,列舉了空調環境監控主要内容。

監測系統是資料中心的一面鏡子

通過對空調環境的監控,及時了解資料中心制冷情況,内部運作環境情況,為運作裝置提供良好的運作環境,避免過冷或過熱的環境影響到運作裝置的使用壽命。資料中心裡裝置産生的熱量非常大,需要空調及時将熱空氣排出去,否則對資料中心危害很大,甚至可能引發火災事件,這方面已經有過曆史教訓。一個封閉性很好的資料中心機房,空調停轉半小時,部分裝置就可能出現當機情況,有些裝置自動保護不夠好,持續的高溫就可能造成線路短路,産生火花,引發火災。擁有全面的空調監控系統,就可以避免這種情況發生。

在表3裡,列舉了資料中心屏顯中心監測主要内容,一個往往是有個巨大的會議大廳,前面有一幅超大的螢幕,上面會顯示各種各樣的資料,這些資料代表了各個系統和業務的運轉情況,一旦有故障可以及時地在螢幕上顯示出來。屏顯中心的所有資料都采集各個監測系統。一般屏顯中心也是各路上司經常光顧的地方,通過屏顯中心了解整個資料中心的運作狀況以及資料中心的各種運作設施。

監測系統是資料中心的一面鏡子

還有一個監測系統非常重要,就是管理監控,這主要是對資料中心進行有效管理時做參考。在表4裡,列舉了管理監控涉及的主要内容,這部分一般是由管理人員來控制,對資料中心進行全面管理,不僅僅業務層面,還有人員的教育訓練、考核、考勤等等。

監測系統是資料中心的一面鏡子

除了以上這些監測名額,還有消防、安防、日志管理、視訊監控、門禁系統、賬号管理等等,資料中心需要監測的内容非常多,上面隻是将最為關鍵的部分拿出來做了介紹。這些監測系統涉及很多專業技術,有些設計還非常複雜,需要由專業團隊才能完成部署,做一套完整的資料中心監測系統難度不亞于建造資料中心本身。一個資料中心監測系統做得好壞也直接決定了這個資料中心的營運水準。是以如果要對資料中心進行評價,監測系統往往是被考察的重要部分,這是資料中心水準的直接展現。

資料中心監測的根本目标是用盡可能少的營運成本獲得盡可能高的系統可用性。高可用性是資料中心水準表現最為重要的标準,而監測系統就像高可用性管理的一雙眼鏡,有了它整個資料中心運作情況才能一目了然,高可用性的目标才具備實作的管理基礎。

本文轉自d1net(轉載)

繼續閱讀