天天看點

董耀祖:雲原生是趨勢,多雲、邊緣雲也變得很熱

10月23日,第二屆中國雲計算基礎架構開發者(CID)大會在滬舉行。作為CID大會聯合發起人、CID大會聯合主席、英特爾亞太研發有限公司資深首席工程師,董耀祖日前接受了大會組委會采訪,分享了籌組大會背後的故事。董耀祖博士主要從事作業系統和雲計算領域研究,也是國際上最早期的開源虛拟化方案的主要貢獻者之一。2005年,他單獨主持開發國際上第一款安騰架構上的完全虛拟化實作。2008年到2009年主持國際上第一款SR-IOV虛拟化産品的開發,2012年提出和主持了粗粒度鎖步虛拟機的高可用方案項目。

您好董博,聽說您也是CID大會的創始人之一,請問您當時創立CID主要是基于什麼想法?

董耀祖:從二十一世紀第一個十年開始,虛拟化技術快速進入IT領域,通過虛拟化軟體将單一的實體機器切分成多個虛拟的計算機執行個體。基于虛拟化技術和網絡技術,把計算資源、存儲資源和網絡資源做成像自來水和電一樣按需使用、按使用付費的商業模式,即雲計算,開始被提出并且得到廣泛的關注。随着國内外的一批頭部企業的推動,基于雲計算的商業服務開始大量出現,并逐漸成為一種新的IT部署形态。

在最近的十年,國内雲計算技術的發展相當迅速,雲計算基礎架構相關的開發人員數量巨大(個人保守估計超過十萬),參與的企業數量也是非常的多。對于這樣的一批開發人員,他們有需要一個場合能夠互相溝通交流最新的雲計算技術,進而掌握和發展最新的雲計算技術。

大約在2020年5月,我開始産生籌組這樣一個雲計算基礎架構開發者大會的想法,在一個私下的機會,我和阿裡雲的陳緒以及英特爾公司的同僚馮曉焰談起此事,結果我們三個人看法非常一緻,大家都覺得這是一個非常必要的舉動。我們三人一拍即合說幹就幹,我和陳緒開始分頭行動,聯系國内的相關頭部企業,尋找有共同志願的推動人和發起企業。我們聯系了位元組跳動的張宇、騰訊的陳立東和華為的梁冰,大家都非常認可這個想法,于是第一屆CID大會的籌委會就這樣形成了。我們也同時找來了老朋友兼清華大學副教授陳渝老師,一起發起了第一屆CID大會。

因為疫情的原因,第一屆CID大會和1024程式員節一起舉行,主要是以線上形式為主,不過也吸引了很多線下的參與者。考慮到疫情的好轉和CID的初衷是為了給雲計算基礎架構的開發者提供一個互相溝通和交流的機會,今年的CID會議我們選擇了以線下為主的形式舉行。我們10月23号在上海見到了各位開發者朋友,一起交流,共同提高。

Intel®作為全世界最大的晶片廠商和雲計算領域的第一基礎算力提供商,請您談談Intel®在雲計算和雲計算基礎架構方面的最新布局和研發成果?

董耀祖:過去三十多年來,英特爾與中國建立了長期的合作關系,共同緻力于數字基礎設施的建設與革新,以促進行業及經濟發展。目前,世界上有“四大超級技術力量”,它們是産業塑造數字化轉型的核心,而這些超級技術力量使我們能夠推進創新、探索與增長。其中很重要的一個超級技術力量就是“從雲到邊緣的基礎設施”,它創造了一個動态可靠的路徑來連接配接計算和資料,實作規模和容量無限擴充的雲與無限延伸的智能邊緣相結合。

英特爾在資料中心、雲、5G和智能邊緣領域擁有廣泛的布局與技術底蘊,為行業客戶提供強大性能和工作負載優化,加快對人工智能、資料分析、高性能計算等多種複雜工作負載的開發和部署,充分賦能行業數字化轉型。

2021年4月,英特爾推出首款采用10nm制程工藝設計生産的第三代英特爾至強可擴充處理器(Ice Lake)。2021年8月,英特爾公布全新的引領行業标準的資料中心架構Sapphire Rapids, 搭載全新的性能核以及多種加速器引擎。同時,也宣布了英特爾全新的基礎設施處理器(IPU)以及超凡的資料中心GPU架構Ponte Vecchio, 其具備英特爾迄今為止最高的計算密度。

Intel®公司十分重視雲原生的未來,并且加大了在這方面的投入和研究,能不能請您講講都有哪些具體的雲原生研發動向?

董耀祖:對于雲原生這個話題非常大, 涉及到的技術、開源項目也非常多,如果您對技術非常感興趣的話可以去檢視下 Cloud Native Computing Foundation(CNCF)的遠景規劃。就雲計算技術而言,雲計算基礎設施架構已經發展到了以雲原生架構為核心的第二代乃至第三代架構了,其技術基礎是以容器和容器編排技術為中心。

Intel® 在雲計算基礎設施硬體技術方面,除了有計算、網絡、存儲、安全等産品和技術外,我們在軟體研發、技術創新方面也投入了非常多的資源和人力,我們很重視雲原生技術的研發、創新和相關應用場景落地,在整個雲計算軟體生态中,我們的貢獻包括很多,比如 Linux核心,虛拟化技術KVM, 輕量化虛拟機Cloud Hypervisor, 安全容器Kata Containers, 容器運作時與容器編排技術等。

為了讓使用者在Intel®的硬體平台上獲得最佳性能體驗,我們也和業界合作夥伴們一起研究,優化workload,Microservice benchmark,FaaS(Serverless)等,同時,相應我們客戶的需求,也會和生态夥伴一起開發多雲管理、邊緣雲等解決方案。你會看到,除了雲原生已經是大趨勢之外,多雲、邊緣雲等技術也變得很熱,業界已經開始部署相關産品和服務。

具體技術研發方面,我們也不會重複造輪子,像Kubernetes已經成為事實上的雲原生容器編排技術标準,那我們在Kubernetes的研發投入方向就是使Intel®的全線産品(包括計算,網絡,存儲,安全),比如CPU, GPU, VPU, FPGA, Optane 存儲産品,E810網絡産品以及SmartNIC能夠在Kubernetes平台上快速內建,使用穩定。同時,也通過內建各種裝置插件、資源管理技術來提供更多的功能,加速和優化其容器業務。

以CRI-RM (Container Runtime Interface – resource Manager)為例,我們通過在節點上的動态劃分系統資源,配合Kubernetes 排程器,實作在節點層面上的最優任務編排,把Intel®平台的特性适配到Kubernetes的叢集環境裡。通過CRI-RM,在大規模企業級資料庫運作場景裡,我們可以獲得超過10%的性能提升。

舉另外一個例子,最近我們在CNCF裡,提出了一個對Kubernetes的裝置管理進行全面更新改造的提議,稱為Container Device Interface。通過CDI,我們可以把K8s叢集節點上的裝置提供更符合應用使用邏輯,更細粒度的配置設定和管理。這個提議目前在KEP階段,我們已經和社群合作夥伴進行了深度讨論,獲得了積極的響應。

當然,随着雲原生技術架構的演進,無服務Serverless,服務網格Service Mesh也被雲服務提供商大規模部署,而且使用場景也越來越成熟。

k8s 和容器是近年來的熱門技術,請您談談Intel®對容器和k8s的看法以及Intel®對容器和K8S社群開發的支援和貢獻?

董耀祖:确實就像你說的,這兩個技術很熱,Intel®也重視這些新技術的興起和發展。就容器技術本身而言,它已經成為雲時代應用軟體傳遞的标準,并且它是雲原生架構中不可變基礎設施的基礎。 按照OCI (Open Container Initiative)的定義,它涉及到兩個核心,其一就是容器鏡像格式标準,另外一個是鏡像運作時規範,也就是對容器的全生命周期管理。

對于這些通用的容器技術,社群已經很積極地在推進,Intel®主要的貢獻集中在運作時接口,運作時資源管理以及安全隔離等方面,這就是開發者看到的Container Runtime Interface (CRI), Container Runtime Interface – Resource Manager (CRI-RM),以及安全容器Kata Containers開源項目。

而Kubernetes 已經成為容器編排事實标準,被大規模部署,作為第一個CNCF托管項目,從技術上已經非常穩定成熟,可用性也很好。Intel® 作為首批CNCF成員,對Kubernetes社群的貢獻一直名列前茅,我們的具體貢獻主要在底層資源管理以及優化上,比如CPU 管理,NUMA拓撲管理,記憶體大頁配置設定與管理,裝置資源插件管理等。

除此之外,随着微服務,無服務, FaaS這種業務的大規模部署,業界對于容器的安全隔離,快速啟動,資源消耗低等提出強烈的需求,我們也和合作夥伴一起開發了輕量化虛拟機項目Cloud Hypervisor 來滿足雲原生架構下高效的資源隔離,目前Cloud Hypervisor 已經成為安全容器Kata Containers預設的虛拟層。

Intel®在k8s 和容器方面的貢獻很多,比如:利用Kubernetes的API能力來擴充其平台能力使得系統能夠相容,內建更多的硬體功能和裝置資源來豐富Kubernetes的網絡、存儲、加速器、GPU、安全性等能力。這将大大提高雲工作負載的安全性和性能,這些項目都是開源項目,可以通路:https://github.com/intel/intel-device-plugins-for-kubernetes

再比如自動縮放,我們希望與生态夥伴,k8s社群合作,解決自動縮放中的一些技術挑戰:容器業務水準自動縮放、容器業務垂直自動縮放以及大規模叢集自動縮放。我們有很多相關的技術,可以幫助到社群的使用者和我們的客戶。這些技術的采用将極大地提高雲服務提供商的資源使用率。如果您看到了這些挑戰并希望共同努力來解決,請聯系我們。

Kata Containers 是Intel®在傳統容器基礎上的提高,兼顧容器的簡易部署和安全隔離。請問Intel®未來安全容器的态度是什麼?

董耀祖:Intel®是安全容器最早的發起者和堅定的支援者,安全容器提供虛拟機級别的安全隔離、性能隔離以及故障隔離,多核心又天然支援多租賃方業務。安全容器已經成為很多網際網路雲廠商開展業務尤其是Serverless業務的首選。

未來,Intel®将在兩個方面繼續和合作夥伴合作創新:

一是進一步提高安全容器的靈活性和性能,使得安全容器能夠滿足普遍的業務使用需求;

二是機密容器,随着雲原生承載越來越多的應用場景,安全已經變成很多高價值服務和資料雲化的核心因素,機密容器把機密計算無縫內建到雲原生和容器生态。

同時,Intel®推出了硬體安全技術,比如Intel® SGX® 技術和Intel® TDX®技術,我們會将這些技術內建到開源項目Kubernetes和Kata Containers中。Intel®将堅定不移的和社群以及生态夥伴積極推動相關技術的發展,共創機密容器和安全容器美好未來。

董博士您前面提到Intel®提出的Cloud First Client的理念,能不能請您談談它的技術細節以及落地的場景等等?

董耀祖:Cloud First Client(CFC) 協助雲端一體化,用雲計算的理念讓計算在雲和端上靈活的編排,緻力于提供最佳的使用者體驗。服務提供商采用了Cloud First Client可以有很多好處,比如:

充分利用端的能力提供更多的服務的彈性;

讓計算更靠近資料源進而保護使用者資料;

開發者可以隻開發一次服務,這些服務可以靈活地運作在雲或端。

關于技術細節。CFC利用了雲計算的理念,以容器的編排和Kubernetes為基礎,讓服務靈活地部署于雲或端。不同于傳統雲計算的是,CFC為了更好地提供彈性,是由有計算餘力的用戶端發起的Orchestration(編排),而不是由雲端掌控的。這樣便提供了更多的擴充能力和彈性,同時也保護了使用者的裝置,避免用戶端裝置被雲端完全接管。在端的裝置可以提供算力的時候,CFC利用Kubernetes強大的編排能力,我們可以讓提供服務的容器在端裝置上運作。在端能力有限,我們又可以通過DNS的切換,把服務重新切回雲端。

對應的場景可以有很多,舉一個具體的例子——語音轉文字場景。在雲計算時,使用者的語音需要上傳到雲端,由雲端進行文字轉換傳遞到用戶端。而開啟了CFC之後,語音轉文字的服務部署在用戶端,客戶就可以不需要上傳語音,在本地就進行文字轉換。采用CFC降低了示範,節約了帶寬,雲計算的資源,也保護了使用者的隐私。(完)

董耀祖:雲原生是趨勢,多雲、邊緣雲也變得很熱