在 6 月 9 日 2020 阿裡雲線上峰會上,阿裡雲智能基礎産品事業部進階研究員蔣江偉重磅釋出了雲原生裸金屬方案。

作者 | 阿裡雲原生
新一代容器服務 ACK,可以将最新神龍彈性裸金屬執行個體的強大性能發揮得淋漓盡緻,具備極緻性能、高效排程、全面安全的特點:
- 新一代神龍架構具備業界第一的 I/O 轉發能力,提供最高 100G 網絡帶寬;阿裡雲高速 Terway 容器網絡通過網卡直通和資料平面加速,延遲下降 30%;
- 第 7 代執行個體最大支援 192 個 vCPU。ACK 智能 CPU 排程可以輕松釋放強大算力,無需應用調整可以實作 QPS 20~30% 提升;結合 ENI 網卡密度提升,可以縮減 50% 的計算成本;
- 彈性裸金屬執行個體支援阿裡雲安全容器,提升端到端安全隔離能力,與開源方案相比性能提升 30%,也支援阿裡雲首發機密計算容器,基于軟硬一體技術有效保護資料隐私。
在阿裡巴巴内部,神龍架構已大規模應用于淘寶、天貓、菜鳥等業務,解決了高峰值下的業務性能和穩定性問題。在外部,尤其是在這次疫情影響下,很多企業面臨快速擴容的壓力,如線上教育行業,通過阿裡雲容器+神龍方案,企業可以從容應對流量突增的難題。
視源股份(CVTE)的希沃系列教育平穩應對疫情期間指數級增長的課堂流量,視源電子運維負責人許坤豐稱,“疫情之下,希沃課堂作為教育資訊化應用和服務工具提供商,免費向全國師生開放希沃雲課堂線上直播方案。不久前,全國超過 30 萬教師使用希沃雲課堂開課,共開設超過 200 萬節課程。面對指數級增長的流量,我們在阿裡雲容器服務 ACK 上使用神龍伺服器和 ECI,順利完成擴容,讓系統得以正常運作。ECI 的簡單易用,海量節點的特性加上神龍伺服器高性能,零抖動的特點,極大緩解了擴容的壓力,讓我們把更多精力放在産品本身,給全國老師和學生提供更好的服務。”
雲計算開源産業聯盟上周公布了“雲原生應用十大優秀案例”評選結果,阿裡雲支援的申通通用雲原生計算平台順利入選。申通基于雲原生裸金屬方案完成遷雲,實作了圍繞快遞包裹生命周期的高效管理,平穩度過 雙11 業務高峰。
雲計算開源産業聯盟對申通通用雲原生計算平台評價稱“該平台解決了傳統應用更新緩慢、架構臃腫、不能快速疊代等問題,通過雲原生架構體系,在成本、穩定性、效率、賦能業務等四個次元獲得顯著成效。目前核心業務系統已經在雲上完成流量承接,每天處理訂單量在千萬級别,處理物流軌迹在億級别,每天産生的資料量在 1T,使用 1300+ 個計算節點來實時處理業務。”
神龍架構是容器的最佳載體
2017 年 10 月,阿裡雲在全球率先推出了同時融合實體機和虛拟機特性的“跨界”雲伺服器——彈性裸金屬伺服器神龍 X-Dragon,它采用了自主研發的虛拟化 2.0 技術,兼具“虛拟機的心髒”和“實體機的肌肉”,被認為是雲計算領域的新物種。從 2017 年釋出第一代神龍架構開始,曆經了軟體虛拟化、通用硬體虛拟化、專用硬體晶片虛拟化三個階段後,第三代神龍架構實作了裸金屬伺服器、ECS 虛拟機,彈性容器執行個體 ECI 等多種計算平台的架構統一和全面優化。
蔣江偉在演講中也提到,客戶普遍有個共識,那就是容器與實體伺服器的結合是最佳搭檔。但是普通實體伺服器天然具有一些缺陷,比如運維複雜度高,缺乏彈性。而以神龍架構為基礎的裸金屬伺服器,搭配容器服務 ACK,不僅提供非常好的性能,同時具備虛拟機的運維靈活性,正好彌補了實體伺服器的彈性缺陷,對于建構容器環境而言,裸金屬是更好的選擇。
據蔣江偉介紹,雲原生裸金屬具備極緻的彈性、高效的排程能力和更全面的安全能力。在普通的應用場景下,基于神龍架構的容器服務ACK與自建容器相比,可以實作QPS提升30%,計算成本下降50%,容器安全性能提升30%。
對于線下傳統實體機伺服器,企業客戶最大的痛點就是缺乏彈性,運維複雜,無法應對快速發展的業務需求。神龍裸金屬伺服器,具備虛拟機的體驗,實體機的性能。擴容傳遞周期幾周縮短到分鐘,與虛拟機相比性能“零損耗”、“零抖動”,與傳統實體機相比成本效益提升 20% ,是使用者上雲的最佳選擇。
釘釘以前 100% 部署在普通實體機上,疫情突發之後,政府、企業和學校對線上協作的需求猛增。通過雲上神龍裸金屬+容器彈性部署方案,快速地實作了釘釘業務應用 10 萬核擴容需求;借助神龍+容器的超高性能支撐釘釘扛住了有史以來最大的流量洪峰。
此外,社群版本 K8s 容器排程技術存在一定局限,無法充分使用神龍裸金屬伺服器強大的算力。應用在多 CPU 核心場景下,可能會引起資源争搶、CPU 頻繁切換等情況。通過開啟容器服務 ACK 的智能 CPU 排程,可以提升緩存的命中率、減少 CPU 中斷和切換次數,有效提升性能,在不增加硬體資源的情況下性能提升 20%,QPS 從 25 萬提升到 30 萬。
容器服務 ACK 不但支援對 CPU 的高效排程,還新增了對業界最強算力 AI 晶片 - 含光 800 的多核排程支援,可以**成倍提升 **AI 業務資源使用率和成本效益。阿裡自研的含光 800 晶片具備強大的應用算力,在淘寶的拍立淘場景中,對商品庫每天新增 10 億商品圖檔,使用傳統 GPU 算力識别需要 1 小時,使用含光 800 後可縮減至 5 分鐘。對于強大的含光 NPU 晶片,阿裡雲容器服務 ACK 獨創了面向容器的虛拟化和共享能力,充分發揮含光 800 多核資源,把多種業務精确排程到同一含光 800 晶片,充分利用計算資源,顯著降低計算成本!
傳統企業,尤其是一些大型企業,對從私有資料中心遷移到公有雲上并不放心。其中資料安全問題是首要關切,需要獨享使用實體機才會有安全感。雲原生裸金屬方案,結合阿裡雲安全沙箱容器技術,提供從基礎設施到應用運作時端到端安全,非常适合對隐私和隔離要求較高的應用場景,而且與開源方案相比性能提升 30%。
阿裡雲此次首發機密計算容器,基于軟硬一體技術實作全鍊路加密,有效解決資料洩露、非法資料通路等問題,可以應用在區塊鍊、金融交易、基因計算等業務場景中。
雲計算的下一站,是雲原生
神龍是面向雲原生設計的新一代雲基礎設施架構,同時支援裸金屬伺服器、ECS 虛拟機,ECI 彈性容器執行個體等多種計算形态。神龍架構采用軟硬一體設計,可以将網絡和存儲的轉發任務解除安裝到神龍晶片上,避免了底層資源争搶而導緻的 ECS 虛拟機性能波動。第三代神龍架構還引入硬體級别 QoS 能力,為客戶關鍵業務帶來更強的保障。基于神龍架構的 ECI 彈性容器執行個體,性能優于虛拟機中運作的相同規格 Docker 容器;具備極緻的彈性能力,可以在一分鐘内擴容 1000 業務容器執行個體。
客戶可以在一個 ACK K8s 叢集中劃分不同節點池統一管理彈性裸金屬執行個體,ECS 虛拟機執行個體和彈性容器執行個體。根據應用負載特性,可以充分優化計算效率、提升資源使用率、降低計算成本。對于需要極緻性能和強安全隔離場景,使用者可以采用裸金屬執行個體;對于存在明顯業務峰谷的場景,虛拟機執行個體可以提供更靈活的彈性。而彈性容器執行個體可以更好應對突發業務流量,提供免運維的使用者體驗。
容器服務 ACK 已經成為企業雲原生作業系統,與 EDAS 微服務架構,ARMS 端到端可觀測能力全面內建,全面提升 IT 靈活性,為企業數字化轉型提速。
課程推薦
為了更多開發者能夠享受到 Serverless 帶來的紅利,這一次,我們集結了 10+ 位阿裡巴巴 Serverless 領域技術專家,打造出最适合開發者入門的 Serverless 公開課,讓你即學即用,輕松擁抱雲計算的新範式——Serverless。
點選即可免費觀看課程:https://developer.aliyun.com/learning/roadmap/serverless
“阿裡巴巴雲原生關注微服務、Serverless、容器、Service Mesh 等技術領域、聚焦雲原生流行技術趨勢、雲原生大規模的落地實踐,做最懂雲原生開發者的公衆号。”