天天看點

AI性能最高提升20倍 阿裡雲新一代GPU雲伺服器亮相 搭載NVIDIA A100

AI性能最高提升20倍 阿裡雲新一代GPU雲伺服器亮相 搭載NVIDIA A100

近日,阿裡雲異構計算宣布上線gn7 GPU系列雲伺服器,即日起開放售賣。gn7系列執行個體是阿裡雲新一代GPU計算執行個體,主要面向AI訓練和高性能計算應用。該産品基于NVIDIA A100 Tensor Core GPU打造,雲伺服器中的8塊A100 GPU以NVIDIA NVSwitch實作了GPU之間的NVLink直接通信。

結合最新支援的Tensor Core加速能力,阿裡雲gn7雲伺服器最高可讓AI最佳性能提升20倍,高性能計算速度提升2.5倍,單卡最高支援19.5TFlops(FP64)、156TFlops (TF32)、312 TFlops(FP16 混合精度)的運算。對于大模型訓練的場景,阿裡雲自研的神龍AI加速引擎AIACC可以通過優化多GPU訓練通信效率,進一步提升多GPU和多機并行訓練的加速比,為AI研發過程節省更多的時間和成本。

第一批上線的産品為效率最高的阿裡雲神龍裸金屬執行個體ebmgn7, 使用者可直接獲得一台完整的配置有Intel 2代Xeon Scalable 52核CPU、768G系統記憶體和由 NVSwitch互聯的8顆A100 的GPU伺服器主機。

随着人工智能的不斷發展,深度學習的訓練模型越來越龐大和複雜,訓練模型需要的算力也在快速增長。針對AI訓練和高性能計算的算力需求,NVIDIA于今年5月推出了 A100 GPU。NVIDIA A100 GPU基于最新NVIDIA 安培(Ampere)架構,不僅通過制程優化提升了計算性能,同時優化了計算架構,其第三代Tensor Core可以對單精度及雙精度進行加速,大幅提升了整體計算性能。

阿裡雲gn7系列雲伺服器上線,意味着各大企業可以立即開始使用最新一代的GPU的強大算力。該系列執行個體适合深度學習場景,如圖像識别、無人駕駛、語音識别等人工智能算法的訓練應用;也适用于諸如計算流體動力學、計算金融學、分子動力學、環境分析等GPU加速的高性能計算場景。

雲是擷取AI算力最為便捷的方式,相較于自行購買伺服器,使用者可以按需要随時購買GPU執行個體資源,訓練和推理任務結束時,自動釋放/停止GPU執行個體資源。阿裡雲擁有亞洲最大的異構計算叢集,加上秒級傳遞的彈性能力,為行業提供強大的AI算力。

針對人工智能場景,阿裡雲異構計算提供了軟硬一體性能優化方案,自研的飛天AI加速器(AIACC)是業界首個支援Tensorflow、PyTorch、MXNet、Caffe等主流開源架構的深度學習加速引擎,它針對訓練場景和推理場景,結合阿裡雲的網絡和異構計算架構作了優化,雲上訓練有2-14倍的性能提升,推理場景下性能提升2-6倍。

AI性能最高提升20倍 阿裡雲新一代GPU雲伺服器亮相 搭載NVIDIA A100

阿裡雲異構計算産品大圖

前不久,阿裡雲異構計算也推出了獨有的cGPU容器技術和彈性加速計算執行個體(EAIS),與神龍AI加速引擎(AIACC)一起組成阿裡雲異構計算的三大特色優勢,為使用者提供靈活高效、性能超群的異構計算基礎設施。

點選“

閱讀原文

”,了解阿裡雲gn7執行個體的更多詳情。