英伟达GTC大会出王炸，黄仁勋怀揣核弹级CPU、GPU及最强AI来袭

集微网消息，北京时间3月22日晚，英伟达NVIDIA GTC 2022在NVIDIA官网直播举行，公司CEO 黄仁勋在GTC主题演讲中探索讨论AI、Omniverse等前沿科技。

会议的主题包括加速计算和开发工具、自动驾驶汽车、计算机视觉/视频分析、网络安全、数据科学、游戏开发、高性能计算、推理、图形设计协作和数字孪生、推荐系统、机器人以及语音AI/NLP等数十项遍布各行业主题。

值得一提的是，英伟达创始人兼首席执行官黄仁勋先生在 GTC 主题演讲中探讨 AI、Omniverse 等前沿科技，以及 NVIDIA 的新计算平台、创新机器人和虚拟协作技术突破如何赋能各行各业。

具体来看，首先当然是专业用户比较关注的琥珀GPU，在经过相当长一段时间的传闻之后，英伟达这一次终于官宣了这款旗舰级的GPU，命名也跟之前一样，为Hopper架构，核心代号为H100。

首先是制造工艺，与之前传闻的有所不同，H100采用的是台积电4nm制程工艺，不过英伟达将其称之为4N，应该是4nm定制版，同时基于CoWoS 2.5D晶圆级封装，拥有超过800亿个晶体管，英伟达表示这是目前性能最为强大的GPU。此外英伟达也公布了关于H100的具体参数。

要知道，上一代A100还只是7nm架构，这次发布会出来前，外界不少声音猜测老黄会用5nm制程，结果一发布就给大家来了个大惊喜。

最恐怖的是CUDA核心直接飙升到了16896个，直接达到了A100的近2.5倍。（要知道从V100到A100的时候，核心也不过增加那么一丝丝）

浮点运算和INT8/FP16/TF32/FP64的张量运算，性能基本全部提升3倍不止，相比来看，前两代的架构升级也显得小打小闹。

据悉，这次H100也是首款支持PCle 5.0和HBM3的GPU，数据处理速度进一步飞升——内存带宽达到了3TB/s。

此外，Hopper架构的新GPU和英伟达CPU Grace名字组在一起，就成了著名女性计算机科学家Grace Hopper的名字，这也被英伟达用于命名他们的超级芯片。

Grace Hopper发明了世界上第一个编译器和COBOL语言，有“计算机软件工程第一夫人”之称。

除了GPU外，英伟达数据中心“三芯”战略中另一大支柱CPU也有新进展。

在去年GTC大会上，英伟达透露了首款数据中心专属CPU Grace，而在今年，这款面向AI基础设施和高性能计算的超级CPU正式亮相。

这次的Grace有两个版本，第一个版本叫做Grace-Hopper，是"CPU+GPU结合体，使用NVLink技术连接，带宽高达900GB/s。

而名为"Grace CPU超级芯片"的版本则由两个CPU芯片封装组成，它们之间通过NVLink-C2C连接。整个超级芯片总计144个CPU内核（基于ARMv9指令集），缓存容量396MB，支持LPDDR5X ECC内存，带宽高达1TB/s。

这被黄仁勋称作“AI工厂的理想CPU”。

据介绍，Grace Hopper超级芯片模组能在CPU与GPU之间进行芯片间的直接连接，其关键驱动技术是内存一致性芯片之间的NVLink互连，每个链路的速度达到900GB/s。

Grace CPU超级芯片也可以是由两个CPU芯片组成。它们之间通过高速、低延迟的芯片到芯片互连技术NVLink-C2C连在一起。

这很难不让人联想到苹果刚发的M1 Ultra，看来片间互连技术的进展，让“拼装”成了芯片行业一大趋势。

Grace超级芯片在SPECrate2017_int_base基准测试中的模拟性能达到了740分，是当前DGX A100 搭载的CPU的1.5倍（460分）。

Grace超级芯片可以运行在所有的NVIDIA计算平台，既可作为独立的纯CPU系统，也可作为 GPU加速服务器，利用NVLink-C2C技术搭载一块至八块基于Hopper架构的GPU。

Grace CPU超级芯片可运行所有的英伟达计算软件栈，结合英伟达ConnectX-7网卡，能够灵活地配置到服务器中，或作为独立的纯CPU系统，或作为GPU加速服务器，可以搭配1块、2块、4块或8块基于Hopper的GPU。

也就是说，用户只维护一套软件栈，就能针对自身特定的工作负载做好性能优化。

黄仁勋说，Grace超级芯片有望明年开始供货。

AI方面，如今英伟达已经能提供全栈AI，除了AI计算硬件外，其AI软件也有不少进展。

黄仁勋说，AI已经从根本上改变了软件的能力以及开发软件的方式，过去十年，英伟达加速计算在AI领域实现了百万倍的加速。

在本届GTC大会上，英伟达发布了60多个针对CUDA-X的一系列库、工具和技术的更新，以加速量子计算和6G研究、网络安全、基因组学、药物研发等领域的研究进展。

英伟达将使用其首台AI数字孪生超级计算机Earth-2来应对气候变化挑战，并创建了Physics-ML模型来模拟全球天气模式的动态变化。

英伟达认为，工业上同样能通过在虚拟环境中模拟的方式，来增加AI训练的数据量，换而言之就是“在元宇宙里搞大训练”。

例如，让AI智能驾驶在元宇宙里“练车”，利用仿真出来的数据搞出半真实环境，增加一些可能突发故障的环境模拟：

除了数字孪生，数字资产的生产也是元宇宙早期建设阶段需要着重考虑的部分。

在这方面，英伟达推出了随时随地能在云端协作的Omniverse Cloud。

黄仁勋认为，第一波AI学习是感知和推理，下一波AI的发展方向是机器人，也就是使用AI规划行动。英伟达Omniverse平台也正成为制造机器人软件时必不可少的工具。

作为虚拟世界的仿真引擎，Omniverse平台能遵循物理学定律，构建一个趋真的数字世界，可以应用于使用不同工具的设计师之间的远程协作，以及工业数字孪生。

黄仁勋认为，工业数字孪生需要一种专门构建的新型计算机，因此英伟达打造了面向工业数字孪生的OVX服务器和OVX SuperPOD超级集群。

Venturebeat对此评价称，“这些案例给元宇宙赋予了真正的意义”。

最后，黄仁勋再次派出自己的虚拟数字人化身“玩偶老黄”Toy Jensen，并跟这个表情生动的玩偶进行了一番流畅的实时问答对话。

（校对/Arden）

英伟达GTC大会出王炸，黄仁勋怀揣核弹级CPU、GPU及最强AI来袭

继续阅读

这个“iPhone时刻”到底是AI的还是英伟达的？

打造一个AI大模型，需要多少算力？

跨境电商热卖的廉价“新”显卡，坑了谁，又拿捏住了谁？

火种初现的国产GPU，谁能突破算力封锁？

英伟达正在“垄断”AI产业，国内厂商准备好了吗？

Python 密集知识点汇总

A股MCU芯片厂商的心事与新事：低端化内卷困局下亏钱卖货，海外巨头切入32位或掀行业大洗牌，车规级和AI结合产品成突破口

无中生有做3D——游戏行业的AI革命

小扎亲自官宣Meta视觉大模型！自监督学习无需微调

CV圈又炸了？小扎高调官宣DINOv2，分割检索无所不能，网友：Meta才是“Open”AI

英伟达芯片一周涨了7万元！GPT带动涨价潮，主力芯片缺口达30万

台积电：最强王者，也难逃周期沉浮

黄仁勋，ChatGPT时代的第一位赢家

英伟达放大招，游戏赛道两天大涨9％！AI＋游戏对行业震动有多大？

硅谷硬通货英伟达，一夜大涨5000亿

何小鹏送吴新宙到英伟达家门口