天天看點

摩爾線程推出全新多功能伺服器GPU産品 MTT S3000,建構元計算新引擎

作者:中經TMT

2022年11月3日,北京——摩爾線程2022秋季釋出會在北京中關村國家自主創新示範區成功舉辦。釋出會上,摩爾線程宣布了全新的多功能GPU産品和MUSA軟體棧等多項創新成果,充分展示了摩爾線程“軟硬結合”的綜合實力。其中,面向伺服器的多功能GPU産品MTT S3000基于MUSA架構打造,能夠支援DirectX、OpenGL、OpenGL ES、Vulkan、OpenCL等主流圖形和計算接口,相容CUDA,可為AI推理和訓練、雲遊戲、雲渲染、視訊雲、數字孿生、數字内容創作等場景提供通用智能算力支援,旨在為資料中心、智算中心和元計算中心的建設建構堅實算力基礎,助力元宇宙多元應用創新和落地。

摩爾線程推出全新多功能伺服器GPU産品 MTT S3000,建構元計算新引擎

算力更新,助力元計算加速

MTT S3000搭載了摩爾線程全新的第二顆多功能GPU晶片“春曉”,包含了4096個MUSA流處理核心及128個專用張量計算核心,半導體規模達到220億,運作頻率為1.9GHz,顯存位寬256bit;搭配32GB GDDR6顯存;支援FP32、FP16、INT8等多種計算精度,其中FP32算力可達15.2TFLOPS。

MTT S3000率先采用了PCIe 5.0接口,是目前GPU行業中首款支援PCIe 5.0标準的産品。PCIe 5.0所提供的高帶寬不僅能提升GPU與CPU的通訊效率,更能在“多卡”部署時提供更大的核間通訊帶寬,提升GPU叢集的整體運算效率和性能。

MTT S3000内置MUSA智能多媒體引擎2.0和硬體虛拟化功能,能夠從多個次元增強顯示卡的應用範圍和使用者的應用體驗。同時,MTT S3000還提供了兩組DP 1.4a顯示輸出接口,由此增加的顯示輸出能力将進一步拓展MTT S3000的業務适應性。

摩爾線程推出全新多功能伺服器GPU産品 MTT S3000,建構元計算新引擎

訓推一體,為AI計算鋪平道路

從資料中心向智算中心和元計算中心演進是行業算力需求發展的主流趨勢,人工智能和元宇宙應用負載對GPU算力的強烈需求是推動這一演進趨勢的關鍵力量。專為提升智能算力而設計的摩爾線程MTT S3000,在與之配套的MUSA軟硬體計算平台的加持下,AI應用性能相比 “蘇堤”可實作平均4倍提升。

MTT S3000及其配套軟硬體産品,實作從算法模型到應用部署的全流程覆寫,能夠為AI使用者提供友好豐富的一攬子解決方案。在算法層面,摩爾線程不僅可以支援使用者的自定義算法模型,同時也提供豐富的預訓練模型庫,賦能廣大AI開發者,提升開發效率;在應用解決方案層面,摩爾線程可提供數字人、數字客服、内容生成等行業解決方案,服務金融保險、教育、醫療等相關的行業使用者。

在深度學習訓練方面,MTT S3000兼具易用性、擴充性和相容性等多元優勢。基于MUSA軟體棧,MTT S3000可實作現有算法的全面支援;能夠支援包含單機單卡、單機多卡、多機多卡在内的多種訓練模式。不僅如此,MTT S3000還相容PyTorch、TensorFlow、百度飛槳(PaddlePaddle)、計圖(Jittor)等多種主流深度學習架構,并實作了對Transformer、CNN、RNN等數十類AI模型的優化。

在深度學習推理方面,MTT S3000支援視覺、語音、自然語音了解及多模态等多個領域主流AI模型。摩爾線程還對MUSA軟體棧持續進行深度性能優化,并推出自研AI推理引擎TensorX,利用任務并發、自适應算法尋優、訪存優化、算子優化等技術,大幅提升推理性能。MTT S3000可滿足生物醫療、金融保險等特别強調高精度推理的行業需求,并提供極緻性能。

同時,借助摩爾線程開發的CUDA ON MUSA相容方案,使用者可以将CUDA上開發的代碼無縫遷移到MTT S3000。

雲原生GPU,算力調用更靈活高效

GPU是目前資料中心需要的關鍵算力,雲原生技術應用在雲計算、雲桌面、雲遊戲等領域也越來越普遍。為此,摩爾線程釋出一系列基于摩爾線程創新性MT Mesh 2.0的GPU雲原生方案。

MT Mesh 2.0可以根據雲端中心應用負載,自動化配置設定GPU計算和顯存資源,實作GPU算力彈性伸縮。既可以将一張GPU随意切分給多個容器或虛機,也可以支援一個容器或者虛機排程多個GPU。

摩爾線程推出全新多功能伺服器GPU産品 MTT S3000,建構元計算新引擎

彈性容器化GPU (sGPU):基于Kubernetes生态,使用MT Mesh 2.0實作靈活和有效調配容器化GPU資源。

彈性虛拟化GPU(vGPU):使用MT Mesh 2.0,率先于行業開創了資源彈性切分技術,無需重新開機即可動态調配和修改GPU虛拟化資源,實作算力按需調用、動态伸縮、用完釋放;引入全新的“時空切分”特性,支援硬體虛拟化(SR-IOV),安全實體分割,最高支援32路虛拟化,支援Windows雲桌面GPU虛拟化,以及統信和麒麟作業系統GPU直通。

安卓容器雲加速技術ACX:使用GPU安卓容器透傳技術和渲染編碼一體化技術,可以加速安卓雲手機解決方案,減少應用延遲,增加并發路數。通過原生支援OpenGL ES、OpenGL渲染架構,和ETC、ETC2等安卓遊戲材質壓縮算法硬體加速,可以提供更佳的安卓雲遊戲渲染效果和相容特性。

視訊雲,助力高清視訊應用和處理

MTT S3000具備強大的視訊處理能力,內建了摩爾線程第二代智能多媒體引擎(MT Smart Media Engine 2.0),可以加速雲端的多種音視訊應用,如視訊AI分析、視訊會議、雲遊戲、雲桌面和實時互動等,最高能夠支援8K超高清HDR視訊實時處理。

MTT S3000支援包括FFmpeg和GStreamer在内的主流音視訊架構,以及不同作業系統下的通用視訊加速API。摩爾線程将多功能GPU中的智能多媒體引擎與圖形引擎、AI計算引擎等結合,提供豐富的SDK開發套件,大幅降低CPU負載與資料拷貝,友善開發者輕松調用,為視訊雲場景所需的超高清轉碼、智能内容生成、AI畫質增強、老片修複、數字孿生、數字人等方案提供可靠支援。

軟硬結合,構築元宇宙應用基石

釋出會現場,摩爾線程還釋出了專為元宇宙應用建構的MTVERSE元宇宙平台及衆多軟硬體産品,包括基于MTT S3000打造的MCCX元計算一體機等。

摩爾線程推出全新多功能伺服器GPU産品 MTT S3000,建構元計算新引擎

MTVERSE以摩爾線程MUSA GPU叢集為算力基礎,為使用者提供計算基礎架構及服務,包括大資料、AI訓練與推理、圖形渲染和實體仿真三大平台,提供從硬體叢集、軟體基礎架構到SDK工具鍊的全棧式解決方案,涵蓋元宇宙中的人、場景和内容等多個核心要素。而上層的海量SDK工具則能幫助開發者和應用程式友善地調用這些能力,實作數字人、文獻了解、語音識别、視覺識别、自然語義了解、對話互動、實體仿真、AIGC内容生成等一系列功能,進一步簡化應用和解決方案的開發難度,縮短開發周期。

元宇宙将引領未來全球數字經濟的發展,目前仍處在早期階段,但随着衆多商業巨頭入局,中國各地政府也先後出台相關政策支援,前景無限廣闊。展望未來,元宇宙必定是以圖形和AI計算為核心基石的內建式應用,實體引擎、渲染引擎和AI技術的發展,很大程度上決定了元宇宙的應用演進步伐。摩爾線程将繼續保持高速的GPU産品疊代創新模式,持續完善軟硬體能力,通過廣泛的生态合作,助推元宇宙應用創新,最終服務數字經濟高品質發展。

繼續閱讀