天天看點

突然下手!美國禁止英偉達高端GPU對華銷售,意欲何為?剛剛,商務部最新回應來了……

作者:烹饪界推薦家常菜單

8月31日,美國政府指令晶片廠商NVIDIA(英偉達)停止向中國銷售部分高性能GPU,根據路透社報道,另一家AMD(超威半導體)也稱收到了相關的禁止指令。

受消息影響,9月1日,國内GPU及AI晶片相關上市公司股價普遍大漲,寒武紀股價一度大漲20%,景嘉微、海光資訊等盤中大漲。

被禁售的A100 和 H100 晶片到底有多強悍?美國此刻突然下手,意欲何為?

目前,國内幾乎是從零開始研發高端GPU,面對高技術壁壘的GPU,追求國産替代的路堪稱一條“孤獨的奮鬥之路”。

商務部發言人表示,中方注意到相關情況。一段時間以來,美方不斷濫用出口管制措施,限制半導體相關物項對華出口,中方對此堅決反對。美方相關做法背離公平競争原則,違反國際經貿規則,不僅損害中國企業的正當權益,也将嚴重影響美國企業的利益,阻礙國際科技交流和經貿合作,對全球産業鍊供應鍊穩定和世界經濟恢複造成沖擊。美方應立即停止錯誤做法,公平對待包括中國企業在内的各國企業,多做有利于世界經濟穩定的事。

GPU是何種晶片,

A100和 H100有多強悍?

GPU是計算機圖形顯示的核心。

相比CPU,GPU更适合于密集型資料處理。其具有高度并行性,可将數學運算應用于高度并行的資料集。雖然CPU也可以執行相同的任務,但不具備GPU的并行性,是以在這些任務中效率不高。

早期GPU多用于2D和3D圖形的計算和處理。傳統上來說,之前GPU最關鍵的市場在遊戲領域。但長期來看,這部分市場增速趨緩,甚至隐隐有下降勢頭。

眼下是算力時代,GPU的應用場景主要是加速智能制造下的數字化轉型。深度神經網絡、資料分析、可視化、網際網路推薦算法、數字孿生等均離不開GPU。除遊戲主機與PC之外,其終端應用還包括伺服器、汽車、移動等領域。

總體上,GPU應用場景主要可以分為兩大類:圖顯和計算。

那麼,被禁售的A100 和 H100 晶片到底有多強悍?

相比于英偉達前一代的 Volta GPU,A100 的性能提升了 20 倍,非常适合于人工智能、資料分析、科學計算和雲圖形工作負載。該晶片由 540 億個半導體組成,打包了第三代 Tensor 核心,并具有針對稀疏矩陣運算的加速功能,對于 AI 推理和訓練來說特别有用。此外,每個 GPU 可以劃分為多個執行個體,執行不同的推理任務,采用 Nvidia NVLink 互連技術可以将多個 A100 GPU 用于更大的 AI 推理工作負載。

然而,這些在 H100 出現之後顯得略有不足了。

在今年春季的釋出會中,黃仁勳釋出了面向高性能計算(HPC)和資料中心的下一代 Hopper 架構,搭載新一代晶片的首款加速卡被命名為 H100,它就是 A100 的替代者。

H100 是一款針對大模型專門優化過的晶片,使用台積電 5nm 定制版本制程(4N)打造,單塊晶片包含 800 億半導體。同時也是全球首款 PCI-E 5 和 HBM 3 顯示卡,一塊 H100 的IO 帶寬就是 40 terabyte 每秒。

Transformer 類預訓練模型是目前 AI 領域最熱門的方向,英偉達以此為目标專門優化 H100 的設計,提出了 Transformer Engine,集合了新的 Tensor Core、FP8 和 FP16 精度計算,以及Transformer 神經網絡動态處理能力,可以将此類機器學習模型的訓練時間從幾周縮短到幾天。

針對伺服器應用,H100 也可以虛拟化為 7 個使用者共同使用,每個使用者獲得的算力相當于兩塊全功率的 T4 GPU。此外,H100 還實作了業界首個基于 GPU 的機密計算。

基于 Hopper 架構的 H100,英偉達還推出了機器學習工作站、超級計算機等一系列産品。8 塊 H100 和 4 個 NVLink 結合組成一個巨型 GPU——DGX H100,一共有 6400 億半導體,AI 算力 32 petaflops,HBM3 記憶體容量高達 640G。

與此同時,得益于與 Equinix(管理全球 240 多個資料中心的全球服務提供商)的合作, A100 和 H100 的新型 GPU 通過水冷方式來節省使用者的能源成本。使用這種冷卻方法最多可以節省 110 億瓦時,可以在 AI 和HPC 推理工作中實作 20 倍的效率提升。

今年 5 月份,英偉達曾開源了 Linux GPU 核心子產品代碼,未來是否還會有更多開源計劃,暫未可知。

突然下手,美國意欲何為?

對于此次美國對中國高端GPU銷售的限制,各方都有說法。

據美國證券交易所官網資訊顯示,美國政府已在8月26日向英偉達發出通知,要求英偉達對中國大陸、中國香港和俄羅斯實施一項新的出口管制要求。該要求包括英偉達公司禁止向這些公司出售A100 GPU和即将推出的H100 GPU,立即生效。美國政府表示,這是為了防止這些産品被用于“軍事最終用途”或“軍事最終使用者”。

多位晶片圈業界人士認為,這是美國全面限制中國技術發展的組合拳,全面減慢中國的發展。

一位AI晶片從業者分析,“此前美國限制EDA的銷售,以及聯合半導體裝置以及晶圓代工廠,是在限制本土基礎技術,包括晶片技術的發展。如今限制英偉達和AMD在中國的銷售,是在阻礙中國應用市場的發展,這也是各大晶片巨頭都非常重要的市場。”

北京半導體行業協會副秘書長朱晶表示,根據消息,被封鎖的産品是有足夠雙精度計算能力的高端GPU,對于低端GPU不受影響。具備較高雙精度計算能力的高端GPU主要用于高性能計算領域,包括科學計算,CAE(計算機輔助工程),醫療等方面。

超算中心即國家超級計算中心,由數千甚至更多處理器組成,具備超高算力,被譽為“計算機中的珠穆朗瑪峰”,主要滿足國家高科技領域和尖端技術研究的需求。

相比之下,普通的資料中心面向所有需要資訊技術支撐的場景,包括大量網際網路應用。中國的電信營運商、網際網路公司都自建資料中心。朱晶表示,企業級資料中心經常采購NVIDIA消息中的A100、H100産品,這些産品都是有足夠雙精度計算能力的高端GPU,上述斷供行為如果落實,造成的波及範圍會比較大。

過往來看,美國已經對中國超算三次“動手”,2015年中國“天河二号”項目相關的4家中國機構被美國列入“實體清單”;2019年,海光、中科曙光、無錫江南計算技術研究所等5家進入實體清單;2021年,飛騰,申威等7家超算機構進入實體清單。

朱晶表示,從上述曆程可以看出,對于中國超算,美國從打擊方式到範圍來看都是更新的。如若消息屬實,這次的打擊方式将是從“超算相關機關進入實體清單”更新為“可為超算提供服務的相關産品直接禁售”, 導緻受影響的範圍從超算領域擴大到網際網路領域。

朱晶表示,對高端GPU的斷供,看似依然是對中國超算和智能計算的進一步封鎖,但波及範圍已經遠遠放大,并且技術點的斷供還要考慮對上下遊的牽連。

國産替代的路有多難走?

這次的銷售限制,對于國産廠商來或是莫大機會。

有行業内人士認為,國内BAT等做大資料的廠商将被迫走上國産替代的道路。海光、壁仞、燧原等廠商的GPU從功能性上說可以取代部分市場對英偉達GPU的需求。

“這一政策變化意味着強制國内資料中心進行國産化替代基本上已經成為必須要求。”AI晶片從業者也表示。

不過,目前國内有機會替代英偉達GPU的産品還幾乎沒有,遇到了比較大的落地挑戰,中國AI晶片公司的發展任重道遠。

為何發展高端GPU如此之難呢?

總的來看,技術架構為GPU的硬體壁壘,算法及生态是GPU的軟實力所在。缺一不可,壁壘極高。具體來看:

硬體架構方面,GPU結構精密複雜,是長期技術演進的結果。進階圖形處理步驟較多,包括頂點處理、光栅化、紋理貼圖等步驟,給予支援的是底層精密 複雜的硬體結構。以英偉達2018年推出的Turing架構為例,其包含4608個CUDA Core、576個深度學習矩陣運算單元、72個光追單元等。

算法方面,GPU圖形渲染需用到計算圖形學,涉及數學、實體等多學科知識。模拟真實世界時,即便是樹葉抖動、風吹發絲、水波蕩漾這樣看似平常的場景,若想在計算機上實作,都需要大量圖形算法。

生态方面,分析師指出,軟體生态是GPU廠商的重要競争屏障。還是以龍頭英偉達為例,公司已與行業夥伴形成商業合作/互相授權,同時,還推出供軟體開發人員使用的CUDA平台,形成開發人員社群生态。

東吳證券也指出,由于缺少像ARM一樣的第三方IP授權廠商,GPU設計商必須完全自主研發,從零做起,難度較大,堪稱一條“孤獨的奮鬥之路”。

A股這些上市公司正布局

即便很難,大陸本土GPU公司新興團隊也已開始不斷湧現,行業發展程序也在持續推進。

在A股上市公司中,有一些小龍頭正悄然成長。

景嘉微(300474)

景嘉微起家于軍工領域,發力于國産GPU晶片。景嘉微早期以圖形顯控和小型專用化雷達産品為主,主要面向軍用領域。2014年,JM5系列産品的研發成功,标志着大陸國産GPU晶片從0到1的突破,此後随着JM7和JM9系列産品的陸續研發成功。

JM5和JM7系列産品主要面向軍用和信創市場,JM9系列産品對标NVIDIA在2016年釋出的Nvidia GTX1080産品,逐漸打開民用市場,與海外GPU晶片巨頭形成錯位競争。

海光資訊(688041)

公司成立于2014年,脫胎于中科院體系,主要産品為面向伺服器與工作站的CPU和面向AI訓練、資料挖掘的DCU,早年技術來源于AMD的x86授權,但目前技術已實作自主疊代,電信、金融是主要下遊領域。

公司位列國内CPU第一梯隊,且是國産唯一的兩家X86架構企業,性能對标巨頭Intel,暫有差距。

此外,海光DCU系列産品以GPGPU架構為基礎,相容通用的“類CUDA”環境,主攻加速計算市場,每兩年快速技術疊代,深算一号DCU達到國際上同類型高端産品水準。

龍芯中科(688047)

公司是國内少數可以進行指令系統架構及CPUIP核授權的企業。與部分國内廠商購買商業IP進行CPU晶片設計不同,公司堅持自主研發核心IP,包括系列CPUIP核、GPUIP核、記憶體控制器及PHY、高速總線控制器及PHY等上百種IP核,全部自主研發成功。

公司長期積累形成自主指令系統架構LoongArch,研發作業系統核心子產品,包括核心、三大編譯器(GCC、LLVM、GoLang)、三大虛拟機(Java、JavaScript、.NET)等,形成了面向資訊化應用的Loongnix和工控類應用的LoongOS兩大基礎版作業系統。

寒武紀(688256)

公司雲端産品線不斷疊代更新,主要面向中高端推訓場景的思元370,與主要面向訓練的高端産品思元290形成協同,在網際網路、金融、營運商、AI等客戶得到廣泛應用,有望接力邊緣端産品成為公司主要營收增長動力。

在自動駕駛晶片方面,子公司行歌科技已規劃不同檔位的車載智能晶片産品,與公司既有的雲邊端産品線緊密關聯,在通用大算力車載智能晶片領域擁有較強的技術優勢和市場競争力,目前已經與一些傳統車企展開戰略合作,向适配L3+車型的大算力晶片看齊。

本文源自價值線

繼續閱讀