講師介紹
龐輝富
•廣通軟體技術總監
•擁有10多年IT運維管理軟體研發經驗
•緻力于自動化運維解決方案的研究和推廣
•主導研發的産品廣泛應用于海關、公安、能源等多個行業
技術發展給運維帶來的挑戰

目前的IT建設在這些新技術的演進下,我們看到的是呈現“雙态IT”特征。Gartner也提出雙模IT理論,與現在談的雙态IT是異曲同工的,不再是一種單純的形态,而是兩種形态交集在一起。
一種是穩态,也是我們經常說的核心業務,比如銀行的核心業務、政府的核心業務等,業務系統一般以傳統IOE或VCE架構設計,因為一旦出現故障對企業和社會導緻非常大的損失,這些損失是很難承受得起的,是以其強調穩。
一種是敏态,就是以“網際網路+”或“+網際網路”的概念把自己的管道或服務開放出來,以便能更好的去創新和發展,敏态業務強調疊代和創新,可以允許适當的試錯,但需要快速疊代。
這兩種形态不是完全孤立的,而是随着企業自身和業界的發展互相進行轉換,就算你不去變,在一定的情況下環境也會倒逼你做轉變。是以我們的運維體系是需要能滿足這兩種形态的IT架構,既能夠滿足穩态的IT架構和管理方式,也能夠适應網際網路之下的新技術架構和靈活管理模式,對運維提出不小的挑戰。
那我們來總結一下前面說的新技術和業務形态給我們運維帶來哪些挑戰。
1)管理規模爆炸增長:物聯網的裝置規模我們先不說,因為其包括很多外場裝置;有句話說未來每一個工業企業都是一個軟體企業,意味着每個公司都需要依靠軟體系統來支撐其業務,我們有一個客戶,就一個資訊中心部門,需要維護400多個業務系統,光伺服器就有幾千台,還不包括虛拟機,是以光靠人肉已經是傷不起了。
2)技術越來越複雜:随着雲計算、網際網路的發展,技術的沉澱越來越快,架構也變得越來越複雜,比如并行計算技術、分布式存儲、大資料分析等等,以前我們一兩台普通PC伺服器能很好運作的系統,現在随着技術的複雜度增加,已經完全Out了,有個非官方的軟體界摩爾定律說法,每18個月軟體的運作速度就會慢1半(因為規模變大了,資源消耗更厲害)。也就是技術的複雜可能解決了業務的複雜度問題,但給運維帶來的挑戰卻非常大。
3)随着雲計算\容器化\分布式\叢集化技術的發展,軟體的變更釋出會變得越來越頻繁,比如亞馬遜談到,現在他們的系統都是微服務化,每天每個團隊會釋出上線30多次,所有團隊1年有幾千萬次釋出。雖然我們沒有那麼大的規模,但也說明現在已經不是半年或者1個月一個版本的時代了,現在至少要求每周\甚至每天都要有1個疊代釋出。
4)現在生活節奏變快,現在我們每個人的耐心越來越有限,對服務中斷的容忍度會越來越低。現在一個網際網路服務如果中斷超過半個小時,那是非常大的事件了,對于一些選擇性多的服務來說,就是損失大量使用者。
優雲自動化解決方案
我們與CMDB結合要選一個自動化的平台。強調平台化,所有的能力轉化為一個個原子操作,同時與其他運維系統有機內建。
1.它能與CMDB一起,打通整個運維的任督二脈
2.它可以不斷豐富基礎操作庫
3.可以複用操作,通過可視化編排,實作個性化的運維場景
4.最終,它可以為不同的運維崗位,提供行業的最佳實踐
相信每個運維工程師都會存有一些“私貨”-運維腳本(無論是Python、Shell也或是批處理),在日常工作中便是靠這些腳本來實作運維的處理,比如軟體安裝、配置修改、清理磁盤空間、重新開機服務等等。這些腳本存在每個運維工程師的電腦裡,沒有經過有機的組織梳理,對環境的适應能力比較差,隻能用于特定場景,無法很好的複用和共享。
為了讓腳本最大限度發揮其生産力,我們需要一個庫将團隊内運維工程師的常用腳本統一管理起來,形成一個個運維的原力-能量水晶-我們可稱其為“操作”,一個操作包括輸入參數、處理腳本和輸出參數。
将一個個操作集中管理起來,形成運維操作庫,供編排使用。
操作隻是實作某個運維目标的一個步驟,我們還需要一個通天雲梯才能到達運維目标的終點。這個通天雲梯便是編排編輯器,其通過可視化的方式,允許使用者按運維場景将操作串接起來,通過操作的輸入、輸出讓各操作共享資料,最終将一個個操作粘合成一架通往運維目标的雲梯-編排。
為了讓一個編排能适應更多環境,編排需要支援輸入參數,将參數傳遞給操作,這樣操作腳本便可根據參數相容不同的環境。
編排編輯器可以長成這樣:
總結一下,剛才我們重點介紹了在不同業務形态下的運維特征及技術發展給運維帶來的挑戰,優雲的自動化解決方案如何讓運維操作更輕松,高效,從三個層面展開說明。希望本文對大家在運維自動化操作上有所思考啟發,後面有機會再跟大家繼續分享其他相關運維實踐。
本文内容整理來自【靈活運維大講堂】龐輝富老師的線上直播分享。