遙遠的東方有一條神龍,它不僅可以在天空(計算)、大地(存儲)、海洋(網絡)間自由穿梭,還能夠在虛拟和現實之間幻化自如。
資料中心三大資源分别是計算、存儲、網絡,這次就讓我們先聊一聊阿裡雲的計算基礎設施,相關的内容來自杭州雲栖大會2019以下三個專場:
- 阿裡雲智能彈性計算專場
- 阿裡雲異構計算專場
- 阿裡雲智能彈性計算使用者實踐專場
在阿裡雲,神龍是計算資源的代表,阿裡雲及阿裡巴巴經濟體的百萬台伺服器都要統一到神龍架構下。

(圖檔來自于2019杭州雲栖大會公開脫敏膠片)
世界上有兩種雲服務商:一種是有裸金屬服務的,一種是沒有裸金屬服務的。所謂的裸金屬就是直接提供實體伺服器硬體給上層作業系統和應用。神龍就是阿裡雲提供裸金屬計算服務的基礎。
伺服器虛拟化是雲服務商進行大規模資源管理和配置設定的利器,可以說,沒有虛拟化就沒有今天雲計算的發展,但總有一些應用場景是不太适合使用伺服器虛拟化的,例如容器叢集、深度學習、高性能計算,這樣的場景越來越多。但直接提供實體伺服器對雲服務商的資源排程管理将帶來嚴重挑戰,這種挑戰還不僅在于資源的初始化和重新配置設定方面,還在于需要同時保有虛拟化和實體機兩個資源池,難免會出現閑置和不足同時發生的情況,另外,實體伺服器對雲服務商圍繞虛拟化平台而建構起來的各種存儲、計算資源的通路也會出現這樣或者那樣的問題。
神龍就是阿裡雲解決上述一切問題的答案,以下是第二代神龍的架構,這也是阿裡巴巴生态體正在采用的一代架構。
神龍架構包含軟體和硬體兩部分:
- Dragonfly Hypervisor虛拟化層、是阿裡雲為神龍定制的伺服器虛拟化系統,具有超輕薄(記憶體<1MB/VM),資源“零損耗”(CPU<0.1%);超平穩、性能“零抖動”(計算平穩性:99.9999%);超平滑,相容原架構(相容KVM架構,支援虛拟機互遷移)的特點。
- 神龍闆卡、不僅支援為虛拟機提供存儲、網絡資源還支援為實體伺服器提供EBS彈性塊存儲和VPC網絡支援,并提供遠超實體硬體的存儲和網絡QOS保障能力。
在神龍伺服器上運作容器平台,可在高負載場景下依然保證較低的網絡和存儲延時:
神龍自從2017年釋出以來,保持每年更新一代的疊代速度,在這次杭州雲栖大會上,将釋出第三代神龍。
第三代神龍将更多的存儲和網絡IO功能加入到神龍晶片中,實作了更低的時延和性能抖動。
說完了神龍,讓我們來到阿裡雲異構計算分論壇,所謂的異構計算讨論的是除了CPU之外的其他計算單元,包括GPU、FPGA、也包括在這次大會上釋出的含光800(NPU)。
阿裡雲的NPU晶片的定位是面向線上推理領域,在杭州城市大腦的應用場景下,4張含光800NPU卡所處理的主城區實時交通視訊需要40張 GPU卡方可處理,使用NPU的延時是150ms而GPU的延時為300ms。
在淘寶網拍立淘場景下,10億張圖檔的識别使用GPU下需要1個小時,而使用NPU隻需要5分鐘,效率提升了12倍。
搭載含光800NPU的伺服器執行個體AN1已經開始公測,号稱成本效益提升100%。
除了自研的NPU晶片,在這次雲栖大會上還釋出了擎天加速引擎:Ali-Perseus。
這是一個統一加速架構,可以讓Tensorflow、Caffe、MXNET、PyTorch這些深度學習架構在阿裡雲上跑的更好,按照演講者的說法就是可以讓A級車有B級車的感受,讓B級車跑出C級車的效果,至于實際表現,阿裡雲請到了小米的工程師以小愛老師作為應用案例進行現身說法。
在擎天加速引擎之外,在異構計算分論壇還釋出了異構加速資源池。這個異構加速資源池希望解決異構計算場景下的以下這些問題:
- 異構資源使用率低、要麼是GPU卡閑置,要麼是GPU的算力無法得到充分使用。
- 資源碎片浪費、在大規模的異構叢集排程場景下,因為GPU和CPU的配比問題而導緻無法充分使用零散的碎片資源,導緻浪費。
- 系統可靠性難題、當出現故障時無法優雅的遷移目前任務。
- AI晶片種類繁多适配難、在這個世界上的AI相關晶片實在是太多了。
在阿裡雲内部的開放測試環境中,通過引入異構加速資源池實作了GPU的高使用率,甚至超賣,在開發測試環境、學生實習實訓環境,能夠進行GPU超賣可以顯著降低這些環境對GPU資源的需求,進而降低了系統的總體成本。
說到對資源的充分利用,HPC高性能計算環境絕對有着最為迫切的需求。因為叢集的管理和排程問題,一般的高性能計算叢集的使用率能夠到30%已經是非常好的了,為了解決這一問題,當年筆者還參與過一些HPC高性能計算叢集的雲化科研項目,在勘探和空氣動力學領域都進行過一些嘗試,勘探領域的問題是資料吞吐的問題,而在空氣動力學領域是節點之間協同的問題。現在有了神龍,既能滿足這些HPC環境對極緻吞吐和穩定時延的要求,又能實作高效靈活的管理和運維,阿裡雲基于神龍推出的E-HPC高性能計算服務已經在包括工業制造、位址勘探、生物醫藥、氣候氣象、電子設計等領域進行了廣泛的應用。
在阿裡雲智能彈性計算使用者實踐專場,阿裡雲智能技術專家作了《SCC規格族:驅動制造工程仿真新未來》的演講,對阿裡雲上的ebm(彈性實體伺服器)和scc(高性能計算)執行個體家族進行了介紹:
- 在神龍的加持之下,同屬于實體伺服器範疇的scc和ebm執行個體都可以接入到VPC虛拟網絡中。
- 都可以使用EBS彈性塊存儲服務提供的磁盤啟動和存儲資料。
- 都可以選擇GPU加速卡。
- 高性能計算scc執行個體還可以使用低延遲時間的50G/100G的RDMA網絡。
最後,在客戶有話說環節,請到了吉利汽車來介紹工程仿真高性能叢集上雲實踐。