天天看點

“不是不需要運維工程師,是人人皆是運維”|對話阿裡雲MVP蔣爍淼(上) ...

【三位阿裡雲MVP(駐雲CEO、首席架構師、大資料總監)《MVP時間》首次同台授課,“湖畔第一大腦” 蔣爍淼領頭線上精講,内容涉及企業IT架構、混合雲存儲、大資料方案等實戰内容,從技術實戰到解決方案,難題痛點一次解透。聽課連結直戳:

第一節:雲時代企業IT智能診斷實踐與探索

第二節:企業IT架構雲化轉型挑戰與應對

第三節:混合雲場景下存儲實踐精講

第四節:雲管理服務技術要點和實踐精講

第五節:混合雲大資料實踐精講】

阿裡雲MVP、駐雲科技CEO蔣爍淼4月11日做客《MVP時間》,為大家分析在雲時代對于企業IT智能診斷的實踐與探索。本篇為上期,下期文檔直戳

1、 雲時代的大背景

屈指算來,雲計算已經進入了第二個十年。随着下一代技術如數字業務、物聯網和人工智能的實作,雲計算已然是業務和IT的關鍵組成部分。雲技術正在從一個市場颠覆者演變為傳統和下一代IT中的主力軍。

“不是不需要運維工程師,是人人皆是運維”|對話阿裡雲MVP蔣爍淼(上) ...

需要強調的一點是,我們認為,真正意義上的雲計算就是公有雲。為什麼呢?

我們先從5G說起。展望未來,5G時代很快到來。大家都在展望伴随5G時代的物聯網、邊緣計算、人工智能、AR/VR的大變革。而更為實際的,5G時代會發生的事情,是固定網絡逐漸退出市場,正如之前固定電話慢慢從市場中推出那樣。每個人的手機電腦都會以無線網絡的方式接入到網際網路中。那個時候企業區域網路就會消失,區域網路消失以後,可能企業内網就消失了,或者說内網就是今天我們在雲上看到的VPC、虛拟專有雲或者虛拟私有網絡,到那個時刻,沒有區域網路,又何來專有雲呢?

随着5G的進入,雲計算的發展還是會非常長久的進行下去,直到大部分IT都轉入到雲計算時代,而那個時候可能會有新的東西出現。

換個角度,今天對于整個世界改變最大的力量是網際網路。未來每一個企業都是網際網路企業,雲就是網際網路基礎設施。是以說掌握雲計算的技術是非常重要的,未來不懂雲計算就沒有辦法在這個市場上生存,如果你是一個IT工程師的話。

2、 雲時代IT從業者的挑戰

雲時代的到來對于IT從業者來說帶來了極大的變革和挑戰。

雲計算大資料技術疊代更新,IT從業者需要掌握的技能更廣,還需跟上工作節奏。

傳統的我們經常會把工程師分成開發人員或者運維工程師、測試工程師,開發工程師又包括前端工程師,後端工程師等。而現在這樣的職業分工也産生了變化的趨勢。

記得前幾天有一篇文章說阿裡雲是不是會殺死運維,大家也知道有個耳熟能詳的詞語叫DevOps。這也說明了一個問題:雲計算廠商把IT基礎設施營運起來了,帶來了一個重大的變化:企業内部并不需要單純的運維工程師了。為什麼呢?一是因為DevOps的發展,二是因為雲計算帶來的極大便利使得很多運維工作被大大簡化。

舉例來說,絕大多數尚未建立完備開發體系的公司,它的開發工程師就可以通過RAM授權的子賬号,甚至主賬号進入雲的控制台修改關鍵雲資源配置,比如對象存儲Bucket的修改。

是以,由于雲的分布式的變化,每一個工程師都可以通過API或者控制台,快速的改變雲的現狀,包括配置資訊的變更。這使得傳統的運維工作離散化了。某種程度上說,不是不需要運維工程師,而是人人皆運維。

在這樣的大背景下,傳統的運維工程師又何去何從呢?他們的職業發展也面臨着巨大的變化。

傳統意義上的運維工程師的主要工作,我們經常開玩笑說是搬箱子,插網線和裝系統三大件。

而今天面對雲,這三件事情都不用做了,因為你使用ECS鏡像伺服器就裝好了,甚至你都不需要自己安裝MySQL,直接使用RDS就夠了。

是以傳統意義上運維工程師本身知識結構面臨着更新,從傳統意義上運維工程師要變成企業内部的雲管理者或者成為企業内部雲架構師,應該往這個方向去轉變。大家也可以到百度百科上看到雲管理者這個新職業的描述。

“不是不需要運維工程師,是人人皆是運維”|對話阿裡雲MVP蔣爍淼(上) ...

3、 雲時代企業IT管理的挑戰

為應對市場變化的快速響應,企業業務的複雜與變動并存,還需保障IT系統的穩定可靠。

1)除了故障,還有什麼更值得我們考慮?

企業将基礎設施甚至中間件使用了雲計算廠商提供的服務之後,如果雲服務出現了故障,我們可以根據SLA的條款,向雲廠商索賠。

因而在雲上,我們最需要擔心的不是雲服務的故障,或者說在雲上除了故障其實我們還有更多問題需要考慮。

舉兩個例子:
           

 前段時間寶馬發生了資料洩漏,原因是它的開發工程師對AWS上存儲Bucket沒有進行任何安全限制,導緻資料可以被任何人讀取,甚至包括Google搜尋引擎。

 系統本身并沒有出現故障,但是發現某些應用連接配接數或者是程序記憶體占有快速上升,存儲量快速上升,很可能是因為開發工程師的BUG,導緻你要為雲計算廠商一個月多付好多錢,浪費了帶寬或者浪費了存儲。

為什麼這些問題不能提早發現呢?有以下幾個原因:

 這些雲資源的管理本身非常繁瑣,往往因為工程師出差或者管理不善等原因,導緻域名證書或者主機本身忘了續費,進而引起了業務的中斷。

 工程師并不具備财務權,傳統職責在故障的發現和處理,而上述這些問題的管理并沒有得到足夠的重視。

是以,重要的問題不是故障,當你到故障那一刻的時候,那個問題已經不小了。

2)複雜、大量資料的挑戰

現今我們處在一個複雜的世界中。這個世界的資料不僅僅包含雲上的資料,還有你自己實體機房或者說外部的資料,甚至還有IOT,數字化的POS機等持續不斷産生的資料。

對一個企業來說,所面對的資料并不一定隻是IT資料,大趨勢是所有資料最終都可能被彙聚到雲上。

3)資訊孤立和不對稱性帶來的挑戰

傳統IT環境中通常會有一個IT部門負責技術保障,維護管理整個企業内部所有系統,但是随着雲的時代到來,任何一個有開發能力或者有系統需求的業務團隊,都可以輕松買一兩台雲主機,裝一個軟體或者開發一個小程式就可以不再依賴公司統一的IT管理,快速的将自己的業務跑起來。是以在這種情況下,雲不僅僅是一個分布式系統,它也使得企業的IT團隊,尤其在一些大企業,開始了有了分布式的傾向和趨勢。

在這種情況下,會造成一個問題,就是大家的資訊可能會相對孤立和不對稱。每個企業的IT管理可能會發生随時随地變化,因為它有可能開在不同雲賬号下,有的一個企業有1000台ECS,可能分布在10個團隊,每個團隊有100台ECS,這種情況也會有大量的出現。

4)多雲和雲計算産品疊代更新快帶來的挑戰

很多企業都慢慢的開始上雲,甚至上多個雲。但是實際上不管是從大的産品功能角度小到API、備份功能或者一個主機的編碼,甚至一些非常非常小的控制參數,比如說備份或者是磁盤拍照等等東西,其實都是不太一樣的。

并且各個雲計算廠商的産品疊代更新都非常快,要管理的要素更多,甚至包括費用。

為了适應多雲環境和雲産品的疊代更新,需要企業投入更多的力量進行統一管理。

比方說因為公司的原因,需要同時用多個雲賬号,甚至多朵雲,分别管理維護開發環境、測試環境、預發環境、生産環境,甚至要從費用角度考慮有沒有資源浪費。

沒有合适工具和管理手段的情況下,管理成本相當高:

 人工的方法是記住不同的使用者密碼,登陸不同的賬号,然後去挨個看。

 進階點的自己有能力去維護一套連接配接了這些平台的API,然後通過API的方式去解決。但這個成本同樣很高,要對雲産品有足夠的了解,萬一雲廠商某個API改了或者是傳回結構改了,還得同步學習更新和修正。

5)企業IT管理對象的複雜度帶來的挑戰

企業IT管理的對象從傳統的實體主機、存儲、網絡、資料庫、中間件變成了雲計算服務商提供的一台台虛拟主機、雲資料庫,甚至是雲中間件,包括RDS、OTS、KAFKA,這些都是以雲服務的形式提供,而無需自己搭建,雲廠商把IT軟硬體資源,甚至中間件都服務化了。我們關心的不僅包括虛拟主機的情況,還有雲中間件、應用層的情況,管理對象更加複雜。

以上各種雲時代對于IT管理的挑戰,也是為什麼我們提出來需要雲時代企業IT智能診斷。

繼續閱讀