天天看點

英國即将成立一個資料中心崩潰報告調查小組

為了幫助行業從像最近的英國航空公司發生的it事故這樣的事件中學習,此次中斷事件在5月底的那個周末取消了數千架次的航班。目前一個即将成立的行業組織将緻力于分享有關資料中心故障的資料。

如果航空公司的一架飛機發生空難,那麼就會立即進行中立調查,以查明出現的問題。資料中心也可以提供這樣的關鍵服務,但其故障或潛在的災難通常被隐瞞,或受到涉及公司的内部查詢,最終被不對外披露協定所掩蓋,其結果是相同的故障将一再反複發生。

資料中心事件報告網絡旨在通過建立一個中立和匿名的論壇來共享關于導緻嚴重的it故障或近乎失敗原因的資料來改變這一點。它将于今年8月3日在英國資料中心利益集團倫敦會議上釋出。

  從失敗中學習

i3 solutions公司創始人ed ansett表示,“人們需要了解的重要事情是許多故障是經常性故障。“我前段時間得出的結論是人們沒有從經驗中學習。”

ansett對許多重複發生的it故障進行了編目,他表示,“很多資料中心的中斷,人們曾多次遭遇,就像兩年前的新加坡證券交易所的中斷事件,但人們需要找出其根本原因,以及如何避免這種情況。”

ansett表示,之是以有了分享這些事件發生原因的想法首先出現在2015年dcd新加坡活動的演講中。他說:“分享的目的不是為了獲得利益,而是一種資料中心的民間學習行為。”

盡管人們通常不願分享自己的資料中心失敗的細節,但ansett相信有些企業會願意分享“資料中心的崩潰的原因和當機的細節”,并以此教育人們。ansett說,“我的感覺是有很多人都想進行分享,特别是幾年前的事情。”

該小組将開始從小做起,但在某些時候,它将需要資助一個審查送出資訊的秘書處。ansett說,任何資金都必須是中性的,而不是來自單一的裝置供應商。資料中心行業沒有相當于民航局可以進行碰撞調查的機構。

目前i3 solutions公司設有一個咨詢委員會,主要緻力調查電力和冷卻領域,但其未來的計劃将達到到更高的層次,其中包括網絡,伺服器和存儲和應用。

在資料中心故障之前,這隻是一個時間問。英國dcig公司的simon allen說。“我們現在需要采取行動,沒有理由這個古老的秘密應該占上風。”

他指出航空業界分享事故資訊的記錄,他說:“在資料中心行業,普遍的做法就是在誤導保護企業聲譽的過程中,掩蓋其失敗或潛在的災難,情況并非如此。其根本原因調查結果通常是秘密的,受到nda的限制,導緻資料中心行業在從失敗中學習中處于不利地位。”

i3 solutions公司的第三方受托人是關鍵任務設施專家peter gross。

本文轉自d1net(轉載)

繼續閱讀