天天看點

雲服務頻頻發生當機 誰的利益最受影響?

雲服務是基于網際網路的相關服務的增加、使用和傳遞模式,通常涉及通過網際網路來提供動态易擴充且經常是虛拟化的資源。它最大的特點,是通過使計算分布在大量的分布式計算機上,而非本地計算機或遠端伺服器中,企業資料中心的運作将與網際網路更相似。這使得企業能夠将資源切換到需要的應用上,根據需求通路計算機和存儲系統。

2012年雲服務開始正式内測,時至今日已經成為與企業和使用者息息相關的技術。目前,亞馬遜aws、微軟azure、阿裡雲、騰訊雲等是市場主流的雲計算服務商,提供包括彈性計算、資料庫、域名、cdn、存儲等支援。然而,雲服務也不是絕對安全的,伺服器的當機勢必會對企業和使用者造成一定的影響,當機也會讓黑客找到空子,進而進行一些非法的活動。

近期,亞馬遜web服務遭到了部分停擺的尴尬,包括netflix, reddit, adobe, imgur均遭遇部分服務載入緩慢,亞馬遜用了11個小時才最終恢複。亞馬遜很快确認,是旗下大名鼎鼎的s3(simple storge service)存儲服務問題,現在原因已經查明。

timg

  雲服務當機誰的利益受侵害?

雲存儲、雲備份等産品及服務的确為衆多企業,尤其是中小企業帶來了便利,但雲存儲同時又是一把雙刃劍,在發生問題時給企業帶來等影響和損失也是非常巨大的。

在雲服務當機之時,對于從事網絡服務的企業來說,流量的影響最為巨大。對于從事電商的企業來說,每分每秒都能決定銷售額,在這背後損失的不僅僅是企業的誠心,同時那些供應商的利益也會受到重大的損失。

對于使用者來說,網絡的體驗和即時資訊的擷取都将受到影響,其中最關鍵的在于,那些守着網絡進行股票、期貨交易的使用者來說,損失将會是巨大的。

如何預防雲服務當機?

雲服務的當機不是雲服務廠商所希望看到的,可當這種事情發生之時,雲服務商們應該做點什麼來應對呢?

為了讓伺服器在最佳狀況下運作,需要保持合适的環境、積極主動地維護和監控,并且制定一項計劃,那樣萬一伺服器果真出現了故障,員工知道該怎麼做。

大型資料中心大多有先進的裝置來監控資料中心的實體狀況,但是許多比較小的公司其伺服器機房并不是處在适當的溫度或濕度範圍,或者沒有做到應有的幹淨。

如果采用預防性維護和合适的監控軟體,就可以避免或減少另外的許多伺服器問題。預防性維護主要包括三項工作:仔細檢查錯誤日志,查找固件或軟體的更新版,以及跑到機房去檢查。

除了在技術層面進行防範外,企業或者使用者首先要對上傳到雲端的資料進行資料備份,同時,将不同的資料在不同的雲端進行備份。備份還要記得定期更新,而且要保證這些備份存儲在一個與雲伺服器不同的位置。

雲服務當機編年史

2014年11月2日下午,騰訊雲伺服器出現了6分鐘的通路故障。騰訊雲網站響應速度慢,圖檔打不開,并出現無法登入管理中心控制台等問題。

2015年3月11日,apple icloud内部dns錯誤導緻其itunes和app store的服務當機,一些icloud的電子郵件帳戶也受到短暫影響。

2015年,5月27日晚6點時左右,杭州、北京、上海、武漢等地使用者反映,支付寶無法正常使用。支付寶公司對故障的回應稱,杭州蕭山某地光纖被挖斷,導緻故障。

2015年6月21日,阿裡雲香港節點當天9點30分左右突然全線崩潰,截至當晚22點才逐漸恢複,整體過程曆時近13小時。

2015年,8月22日,位于美國矽谷的富士通資料中心供電異常,導緻公有雲服務暫時下線,5天後才恢複正常。

2015年,9月20日,亞馬遜aws當機,首先是亞馬遜dynamodb服務出現問題,此後亞馬遜的其他服務也受到影響,同時波及了很多著名網站。

可以說,雲服務發展至今已經成為了企業和使用者最為便捷的技術手段,當機已經成為了家常便飯,雖然人們不想看到當機時間的發生,但防範于未然才是重點所在。

本文轉自d1net(轉載)