
新型冠狀病毒肆虐,為了防止疫情蔓延,社會各界紛紛延期複工和開學。但同時教育部也提出要利用線上模式保障防控疫情期間學生們“停課不停學”。
各大學校與教育機構響應号召,使得近期線上教育需求激增。線上教育學生的學習時間較為集中,高峰時段呈現出大流量、高并發的特點,對線上教育機構的業務彈性和穩定性提出極大挑戰。
面對突增流量壓力,如何迅速動态彈性擴容以及高效管控運維成為迫切問題,原有的架構方案亟需有效更新。
阿裡雲的彈性裸金屬伺服器(神龍)+容器的解決方案,可以完美滿足類似場景,深受線上教育企業認可,并被數家網上教學、遠端協作平台企業應用。這不僅提升了系統整體的可用性和可靠性,也大大簡化業務應用開發疊代流程,從繁重的IT系統支撐工作,轉向線上業務的研發與使用者的支援,“疫情期間”輕裝上陣。
彈性裸金屬伺服器基于阿裡雲自研的神龍X-Dragon架構,神龍将網絡/存儲的虛拟化開銷offload到一張叫MOC卡的FPGA硬體加速卡上,降低了原ECS約8%的計算虛拟化的開銷,同時通過大規模MOC卡的制造成本優勢,攤平了神龍整體的成本開銷。
神龍類實體機特性,可進行二次虛拟化,使得對于新技術的演進發展留足了空間,對于采用一些多樣的虛拟化的技術,像Kata、Firecracker等成為了可能。
這使神龍與容器形成了天作之合。經阿裡巴巴618測試資料顯示,容器運作在雲上神龍反而比非雲實體機的性能要好10%-15%。主要是因為虛拟化開銷已經offload到MOC卡上,神龍的CPU/Mem是無虛拟化開銷的,而上雲後運作在神龍上的每個容器都獨享ENI彈性網卡,性能優勢明顯。
基于容器化建構方式,可以滿足業務快速發放和彈性的要求。底層采用神龍彈性裸金屬伺服器,配合容器服務一起,可以滿足線上教育大流量、高并發、高穩定、低成本的業務訴求。
該方案具備如下五大優勢:
1、極緻性能、使用率提升:阿裡雲容器K8S服務可直接運作于阿裡雲裸金屬(神龍)伺服器上,CPU和記憶體無任何虛拟化性能損失,同時基于神龍技術架構優勢,使得整體性能比同等配置實體機更優。在廣泛的容器化場景中,使用Kubernetes的容器排程能力,可以實作應用的混布,提升3倍以上的資源使用率,充分利用到神龍(X-Dragon)彈性裸金屬伺服器的極緻性能,打造更高成本效益。
2、快速建立、極簡運維:相比傳統實體機數小時傳遞,彈性裸金屬(神龍)伺服器可分鐘級完成執行個體建立和啟動,并利用Kubernetes的排程和編排能力,通過阿裡雲容器k8s服務與阿裡雲基礎設施的緊密協同(SLB, VPC, NAS, SLS等等),在非常短的時間内,支援業務極速部署,極大的簡化、降低了運維的成本,并且提高了線上教育業務架構自動化程度,滿足高峰時段彈性需求。
3、增強網絡功能和性能:相比傳統實體機,彈性裸金屬(神龍)伺服器可支援32塊甚至更多的ENI彈性網卡,阿裡雲K8S Terway容器網絡,配合多ENI彈性網卡,可充分發揮神龍伺服器高帶寬,高PPS特性,容器間跨主機的網絡帶寬相對主控端幾乎無性能損耗,高品質地支援高峰時段大流量和高并發的網絡請求。
4、實體級别的隔離+應用層面的加密:彈性裸金屬(神龍)伺服器的CPU和記憶體具備零虛拟化和徹底獨占的特點,具備更高的安全隔離性,保障伺服器的平穩性。
5、高容錯性與多可用區冗災:彈性裸金屬(神龍)伺服器的當機自動遷移恢複結合K8S的容器容錯漂移,大大提高了系統的高可用性,以及極大的提高了運維的自動化糾錯能力。同時基于彈性裸金屬(神龍)伺服器的多可用區部署,阿裡雲K8S将實作真正意義的實體級别機器上建構應用的跨地域冗災,為線上教育業務的可用性保駕護航。
參考資料:
2684 億背後的虛拟化技術:雙 11 All on 神龍 | 問底中國 IT 技術演進 阿裡巴巴大規模神龍裸金屬 Kubernetes 叢集運維實踐 彈性裸金屬伺服器(神龍)産品頁 阿裡雲上萬個 Kubernetes 叢集大規模管理實踐