雲栖号: https://yqh.aliyun.com 第一手的上雲資訊,不同行業精選的上雲企業案例庫,基于衆多成功案例萃取而成的最佳實踐,助力您上雲決策!
如今,資料轉儲、勒索軟體攻擊、惡意軟體攻擊事件已屢見不鮮,這意味着事件管理政策已成為必要選項。這并不是事件是否會發生的問題,而是何時發生的問題。而且由于目前IT環境的超連接配接特性,基于雲計算的工作負載特别容易受到攻擊。
如果沒有确定的響應流程,企業将無法對安全威脅或意外的基礎設施或應用程式問題做出适當的反應。值得慶幸的是,事件管理是一個完善的過程。
為了減輕制定計劃的壓力,需要了解以下五個步驟,以在事件發生之前進行識别、補救和适應。

步驟1:準備
企業IT團隊建立雲計算事件響應流程時,最重要的事情之一就是為不可避免發生的事件做好準備。盡管準備工作可以采用不同的形式,但通常分為三類:教育訓練、編制文檔和聚合。
(1) 教育訓練
在雲計算事件響應方面,配備合适的人員隻是完成其流程的一半。企業還需要對其員工進行教育訓練,提供充分的資訊和支援,以便在事件發生時進行處理。
雲原生組織必須確定其員工了解如何選擇其提供商的界面,以收集資訊并對發現的内容做出反應。這也意味着員工應該了解企業的事件管理計劃以及對他們的期望。
(2) 編制文檔
企業都應該有可靠的文檔來有效運作。為了支援可能會進行事故響應的員工,這意味着需要建立和維護準确的操作手冊。Runbook是企業員工在生産環境中對可預測事件做出反應時可以執行的一系列正常操作和過程。
Runbook不僅限于安全事件,因為它們還可以引導員工完成諸如如何擴充資料庫或重新啟動卡住的程序等任務。在事件管理方面,對于不熟悉企業架構的員工來說,Runbook是第一道防線。
(3) 聚合
當涉及到事件響應團隊識别發生了什麼、如何發生以及為什麼發生的能力時,資料是關鍵。盡管日志聚合和分析可能非常昂貴,但這些資訊是在以後步驟中進行的任何識别、分類和修複工作的基礎。
步驟2:确定
在團隊對事件做出響應之前,他們需要确定事件發生的時間。這可以通過多種方式實作,但是通常需要識别異常行為。這是一個人工處理的過程,通過梳理使用者報告或檢視日志和分析資料進行處理,但是自動化工具的實施是識别大型雲計算環境中異常行為的唯一可擴充方式。
通過人工處理或自動過程識别事件之後,許多組織可能選擇通知其雲計算提供商并對其進行交叉驗證。這個步驟可以確定企業對實際事件做出反應,而在時間緊迫的情況下,雲計算提供商的支援可以幫助快速結束循環。
步驟3:協調
一旦确定了事件,下一步就是進行組織。在實際解決所有問題之前,需要了解問題的性質和嚴重性,并定義和與響應團隊合作。在這一步驟中,值班人員或企業員工将負責确定報告的性質,并對嚴重性進行初步評估,然後再将其傳遞給其團隊成員。
建立響應團隊:
許多雲原生組織可能規模很小,但針對每次事件可以由其團隊成員進行處理。但是,組織規模越大,可以找到所發生問題的技術專家就越重要。
在事件發生後,将其轉移到團隊成員(也稱為事件指揮者)進行處理,事件指揮者将從相關團隊中确定跨職能上司,以建立雲計算事件響應團隊。該團隊将負責調查和糾正問題。
步驟4:補救
确定活動事件并建立響應團隊之後,開始調查并解決問題。在響應團隊進行調查時,可能需要其他團隊成員和資源來收集盡可能多的資訊。
由于事件固有的不可預測性,很難在這個過程中設定時間表。保持内部溝通管道暢通,以跟蹤進度并了解整體影響。
在網絡安全方面,沒有将可能影響客戶個人的問題通知客戶将最容易失去客戶的信任。重要的是要清楚地了解事故發生時的情況,以及如何補救。對于不向客戶報告事件然後在晚些時候曝光的方法需要謹慎采用。當有疑問的時候,可能在透明度方面犯錯誤。
步驟5:回顧
回顧是完成靈活雲計算事件響應過程的基石,回顧使企業能夠從過去的錯誤中吸取教訓并采取糾正措施,以確定措施始終在不斷改進。突出顯示進展順利的地方,并确定需要改進的地方,以幫助定義行動項目。這使企業的響應團隊可以從過去的事件中學習,并為應對下一次事件做好準備。
原文釋出時間:2020-01-08
本文作者:Zachary Flower
本文來自阿裡雲雲栖号合作夥伴“
企業網D1Net”,了解相關資訊可以關注“
”