天天看點

阿裡雲彈性計算首席架構師分享雲上應用架構演進三大方向

阿裡雲彈性計算首席架構師分享雲上應用架構演進三大方向

從基礎設施和應用層出發,依托雲計算建構更可靠、更靈活和更智能的IT架構,将為企業釋放巨大技術紅利。

阿裡雲彈性計算首席架構師分享雲上應用架構演進三大方向

12月10日,在2021雲上架構與運維峰會上,阿裡雲智能彈性計算首席架構師蔡俊傑發表了主題為“可靠、靈活、智能——雲上應用架構演進”的演講,分享其在“雲上架構”方向豐富的行業經驗。以下為他的演講精華:

一、直面機遇與挑戰,技術驅動業務創新

時代發展到今天,各行各業的企業均面臨着不同的機遇和挑戰。

阿裡雲彈性計算首席架構師分享雲上應用架構演進三大方向

首先的關注點就是社會的生活方式與生産方式的全面的數字化,無論是傳統企業還是網際網路企業,他們的生産系統、辦公系統、商業銷售、客戶互動,都會不可逆轉地全面線上化,比如今的外賣平台或者出行交通系統,都可以用手機操作來達成線上交易。

其次企業所面臨的外部環境變化極快。比如消費者的喜好和需求,随着消費層級及大環境在不斷變化,進而很多零售企業也需要不斷地加快産品上線,提高産品的核心競争力,To C的網際網路企業也如此。10月的雲栖大會上,阿裡雲的客戶映客分享,其新應用上線的頻率高達1次/周。

即便不考慮消費者,競争對手也在不斷地互相拼速度。當下現狀還伴随着不可控的疫情影響,以及監管政策、地緣政治等時刻影響着行業環境。

人工智能、5G、大資料等新技術、同樣也給了企業更多的能力和工具創新、實作自我變革和發展。

企業全面數字化,意味着企業的關鍵業務乃至“身家性命”都已經全部放在IT系統之上,是以企業需要系統足夠穩定可靠,變化迅速的市場和激烈的競争環境,也需要更靈活的研發效率和應用架構來支援業務創新,進而在市場上赢得先機。更需要利用好AI、大資料等新技術,優化業務管理和營運,實作智能化的業務更新。

以上,都需要一個優秀的IT架構來支撐。一個優秀的架構應該具備三個方面的特征:可靠、靈活和智能。

阿裡雲彈性計算首席架構師分享雲上應用架構演進三大方向

雲如何幫助企業建構優秀的IT架構?

每個架構模式都有其适合的場景,企業所處階段的不同、人力資源的多寡、開發人員的技能高低等,都會影響架構的選擇。沒有最好的架構,隻有最适合的架構。并且架構需要持續演進,才能夠支援業務發展。

阿裡雲彈性計算首席架構師分享雲上應用架構演進三大方向
阿裡雲彈性計算首席架構師分享雲上應用架構演進三大方向

不管是從業務需求場景還是技術趨勢來說,架構的發展要求整體來講都是要更可靠、更靈活、更智能。

越來越多的企業,重視高可用架構的建構,使用雙活、多可用區、多地域、混沌工程等豐富的手段來提升應用的可靠性。微服務、Serverless也是近年來非常的熱門話題。以上均是相較之前更為靈活的IT架構,某種程度上,也可以稱作其是更可靠的架構。同時移動網際網路、物聯網的到來也讓資料大爆發,大資料和AI等大計算需求場景也在日益增加。

那麼雲計算如何能幫助客戶建構一個可靠、靈活和智能的架構呢?

01 可靠

在可靠的層面,可以分為兩部分:基礎設施層的可靠以及應用層的可靠。

阿裡雲彈性計算首席架構師分享雲上應用架構演進三大方向

基礎不牢、地動山搖,這是在架構師中流傳很廣的一句話。阿裡雲提供了非常可靠的基礎資源,是全球第一個提供單執行個體可用性SLA 99.975%、多可用區多執行個體可用性99.995%的雲廠商。以上都得益于阿裡雲自主研發的飛天底座,其中有大量的技術創新,比如準确率達到70%以上的智能故障預測、95%以上客戶無感的熱遷移技術等。

阿裡雲自研的神龍架構,也讓整個系統的性能十分線性和平穩,客戶也能夠在使用阿裡雲産品的同時體驗到了可預期的高性能。

當然,單執行個體和單可用區的可用性隻能保證目前地域的高可靠,但不能抵抗極端天氣,工地施工導緻光纖被挖斷等導緻的地域性故障。是以,客戶還需要做好應用層的高可用,使用多可用區、多地域部署等容災方案。

我們建議使用成熟的托管型産品代替自建,比如資料庫和中間件類産品,阿裡雲在這些産品上投入巨大,通常要比自建更加可靠和友善。最終高可用的應用必定是一個面面俱到的架構設計,是高可靠的基礎資源,加上高穩定的托管産品,再加上應用本身的高可用設計組合而成的。

阿裡雲彈性計算首席架構師分享雲上應用架構演進三大方向
阿裡雲彈性計算首席架構師分享雲上應用架構演進三大方向

基礎設施除了做到自身高可靠,還需要透明開放。很多客戶上雲之後,覺得基礎設施層變成了一個黑盒,是以要求提供方能清晰地告訴他們底層的基礎設施在發生什麼,以便他們能做更好的主動運維。

其實這個需求非常合理,是以,ECS會把這些資訊盡可能多地開放給使用者,封裝成不同的接口和事件,提供給使用者,比如使用者可以随時擷取雲伺服器、作業系統等基礎設施的最新情況。系統預測到客戶方的機器可能會當機、檢測到CPU和記憶體用到警戒線了,都會發送事件,客戶可以選擇訂閱。

有使用者回報,最吸引他能長期使用阿裡雲産品的一點就是,阿裡雲有非常豐富和全面的接口。阿裡雲的接口,迄今為止是國内最全面、最豐富、最細緻的,甚至在全球範圍内,也是毫不遜色的。

02 靈活

這個世界變化太快,怎麼辦?所謂天下武功,唯快不破!面對變化,唯一的辦法就是比變化更快。

這就需要一個極度靈活的架構。同樣,企業需要在兩個層面上實作靈活:應用層的靈活和基礎設施層的靈活。

阿裡雲彈性計算首席架構師分享雲上應用架構演進三大方向

企業都在建構靈活靈活的組織架構和軟體架構,這裡面的其中一個核心思想是讓研發團隊之間的依賴更少、更容易地獨立疊代演進,于是企業都開始采用微服務架構,也是符合雲原生趨勢的應用架構。

其實應用架構的靈活也是依托于基礎設施的靈活。越是靈活的架構,越能快速響應不尋常的業務峰值,處理過程也就越平滑,不僅能夠降低成本,客戶體驗也是最好的。比如12306、比如微網誌熱點,這種瞬時級别的流量,線上下的資料中心裡,即便上層架構再靈活,也很難在短時間傳遞和部署如此大的計算量。

靈活的基礎設施,需要做到兩點:靈活傳遞和高效管理。

阿裡雲彈性計算首席架構師分享雲上應用架構演進三大方向

阿裡雲作為領先的基礎設施,首先要做到的就是快速傳遞。

阿裡雲彈性計算提供了多種開箱即用的基礎資源,僅雲伺服器就有上百款規格,并且提供極緻的彈性能力。今年7月,阿裡雲作為首個也是唯一一個通過信通院大規模雲平台性能測試的雲廠商,在信通院從業人員的見證下,18分鐘擴容了1萬台雲伺服器,而這還不是阿裡雲最快的速度。

2021年10月的雲栖大會上,阿裡雲彈性容器執行個體ECI的研發同學,現場示範了在6秒内擴容了3000個POD。借助阿裡雲彈性計算強大的彈性伸縮能力,客戶可以快速地傳遞和部署底層資源,輕松應對流量峰值或者擴容新業務。

針對不同的資源傳遞方式,阿裡雲還提供了豐富的付費模式,客戶可以兼顧靈活與實惠。

阿裡雲彈性計算首席架構師分享雲上應用架構演進三大方向

要真正實作靈活,客戶在管理和使用計算資源的時候,還需要做到非常高效,這就需要各種自動化能力支援。從遷移、部署、運維到容量管理,阿裡雲提供了一整套覆寫資源全生命周期的自動化運維工具。

比如,利用阿裡雲的資源編排服務ROS,可以自動化部署幾千幾萬台雲伺服器。疫情期間,釘釘就使用ROS在短短2小時内新增部署了超過1萬台雲伺服器,平穩渡過流量洪峰。

03 智能

全方位的智能包括業務應用層的智能和基礎設施層的智能。

阿裡雲彈性計算首席架構師分享雲上應用架構演進三大方向

在業務層,企業需要根據自己的業務,引入相對應的機器學習、大資料等相關的技術,實作智能客服、自動駕駛等能力,這些都需要大量的資料和算力作為基礎。為此,阿裡雲彈性計算針對這些場景提供了量身定做的大資料和本地盤執行個體,以及GPU和NPU等執行個體,為上層業務創新提供最适合的基礎設施。

在PaaS層面,阿裡雲提供了豐富的人工智能服務、機器學習和大資料架構等,客戶可以輕松建構上層的應用智能。

在基礎設施層,阿裡雲的排程系統、故障預測和運維系統等,都廣泛使用人工智能技術,使阿裡雲成為全球領先的IaaS技術平台。同時在彈性計算服務的使用者體驗上,我們也利用人工智能技術為客戶提供一個更為聰明的基礎設施。

阿裡雲彈性計算首席架構師分享雲上應用架構演進三大方向

比如智能彈性服務,以往客戶可能需要根據自身的業務特點,在需要的時候提前開好機器給上層業務使用,或者使用阿裡雲的彈性伸縮服務設定好政策,讓其定時開啟。

阿裡雲彈性伸縮産品最新的預測模式,可以根據使用者伸縮組最近1-14天的CPU使用率、内網出入流量等進行模組化,通過機器學習算法預測未來2天整體的使用情況,并自動進行擴縮容操作。使用了這個功能,正常的擴縮容客戶基本上不用費心。

其次是阿裡雲的智能診斷與自助修複工具,當阿裡雲使用者遇到ECS相關的問題時,隻能通過送出工單或者聯系服務同學來解決,周期較長,一定程度上影響了使用者體驗。執行個體健康診斷工具,利用後端的NLP等AI能力,可以幫助使用者快速定位ECS内外部可能存在的問題,并提供修複方案,将問題的解決周期從24小時縮短至分鐘級。在雲伺服器領域,阿裡雲是第一個為使用者開放此全覆寫診斷能力的雲廠商。

再比如阿裡雲的智能資源優化服務,它可以根據使用者的資源使用情況,為使用者識别出資源錯配的情況,并根據業務負載為使用者推薦适合的執行個體。倘若客戶資源使用率長期偏低,造成了成本浪費;CPU負載持續偏高,可能會導緻業務不穩定,它就會推薦您更新配置或者新增資源。

阿裡雲彈性計算首席架構師分享雲上應用架構演進三大方向

整體來看,阿裡雲彈性計算已經不僅僅是一個提供計算資源的平台,而進化成了一個支援應用全生命周期服務的雲平台。阿裡雲通過強勁可靠、覆寫全場景的雲伺服器,高效智能的自動化運維套件,還有靈活彈性的資源供給,幫助客戶建構可靠、靈活、智能的雲上架構。今年,阿裡雲還推出了面向辦公場景的無影雲電腦、以及面向合作夥伴服務上雲的計算巢平台。

阿裡雲彈性計算首席架構師分享雲上應用架構演進三大方向

把雲用好來建構一個優秀的應用架構,給業務帶來的價值是多方面的,包括幫助業務永續、平穩運作,降低了業務的風險;降低成本;提高效率;也正面提升了團隊的人效和幸福感。

蔡俊傑也在末尾給大家分享了兩個實際案例:

阿裡雲彈性計算首席架構師分享雲上應用架構演進三大方向

原來,申通快遞使用線下機房作為計算及資料存儲平台,逢雙11資源需求就會膨脹,大促之後則閑置浪費。上雲後,幾乎全部的資源都是按量購買,穩步度過雙11後即刻釋放,真正做到了開箱即用,不産生一天浪費。2020年雙11與2019年雙11當天對比,相比此前傳統IDC架構方案,使用雲上的神龍裸金屬伺服器+容器服務方案,幫助申通快遞在業務量大幅提升的情況下,IT投入反而降低了30%。

吉利汽車制造企業通過使用神龍超級計算叢集 SCC 在同等硬體基礎上效率提升20%,任務排隊時間縮短了3倍左右,叢集規模随着業務彈性伸縮,最終顯著提升仿真效率近三成,縮短車型設計和推出市場時間若幹個月。

二、從上雲到用好雲,把握技術紅利

阿裡雲彈性計算首席架構師分享雲上應用架構演進三大方向

上雲已經成為了業界的共識。

雲計算雖已發展十餘年,但這僅僅還是開始。我們觀察到,很多的客戶還沒有把雲的紅利與優勢充分地利用起來,比如雲改變得最多的運維領域,大部分客戶還處于半手工半自動化的階段。是以,現在很多企業的關注重點,已經從上雲變成了用好雲。我們相信,未來十年,用好雲,将為企業釋放巨大的技術紅利。

福利時間:12月21日14:00-17:00,澎湃算力,無處不在——2021阿裡雲彈性計算年度峰會,将開啟線上直播。結合企業上雲大勢和雲計算的技術紅利浪潮,本次峰會将在前沿技術、産品生态、上雲實踐等方面帶來最新的業态解讀與創新實踐分享。

點選大會官網,歡迎預約,線上觀看峰會直播。

繼續閱讀