天天看点

英伟达GTC大会出王炸,黄仁勋怀揣核弹级CPU、GPU及最强AI来袭

英伟达GTC大会出王炸,黄仁勋怀揣核弹级CPU、GPU及最强AI来袭

集微网消息,北京时间3月22日晚,英伟达NVIDIA GTC 2022在NVIDIA官网直播举行,公司CEO 黄仁勋在GTC主题演讲中探索讨论AI、Omniverse等前沿科技。

会议的主题包括加速计算和开发工具、自动驾驶汽车、计算机视觉/视频分析、网络安全、数据科学、游戏开发、高性能计算、推理、图形设计协作和数字孪生、推荐系统、机器人以及语音AI/NLP等数十项遍布各行业主题。

值得一提的是,英伟达创始人兼首席执行官黄仁勋先生在 GTC 主题演讲中探讨 AI、Omniverse 等前沿科技,以及 NVIDIA 的新计算平台、创新机器人和虚拟协作技术突破如何赋能各行各业。

具体来看,首先当然是专业用户比较关注的琥珀GPU,在经过相当长一段时间的传闻之后,英伟达这一次终于官宣了这款旗舰级的GPU,命名也跟之前一样,为Hopper架构,核心代号为H100。

首先是制造工艺,与之前传闻的有所不同,H100采用的是台积电4nm制程工艺,不过英伟达将其称之为4N,应该是4nm定制版,同时基于CoWoS 2.5D晶圆级封装,拥有超过800亿个晶体管,英伟达表示这是目前性能最为强大的GPU。此外英伟达也公布了关于H100的具体参数。

英伟达GTC大会出王炸,黄仁勋怀揣核弹级CPU、GPU及最强AI来袭

要知道,上一代A100还只是7nm架构,这次发布会出来前,外界不少声音猜测老黄会用5nm制程,结果一发布就给大家来了个大惊喜。

最恐怖的是CUDA核心直接飙升到了16896个,直接达到了A100的近2.5倍。(要知道从V100到A100的时候,核心也不过增加那么一丝丝)

浮点运算和INT8/FP16/TF32/FP64的张量运算,性能基本全部提升3倍不止,相比来看,前两代的架构升级也显得小打小闹。

英伟达GTC大会出王炸,黄仁勋怀揣核弹级CPU、GPU及最强AI来袭

据悉,这次H100也是首款支持PCle 5.0和HBM3的GPU,数据处理速度进一步飞升——内存带宽达到了3TB/s。

此外,Hopper架构的新GPU和英伟达CPU Grace名字组在一起,就成了著名女性计算机科学家Grace Hopper的名字,这也被英伟达用于命名他们的超级芯片。

Grace Hopper发明了世界上第一个编译器和COBOL语言,有“计算机软件工程第一夫人”之称。

除了GPU外,英伟达数据中心“三芯”战略中另一大支柱CPU也有新进展。

在去年GTC大会上,英伟达透露了首款数据中心专属CPU Grace,而在今年,这款面向AI基础设施和高性能计算的超级CPU正式亮相。

这次的Grace有两个版本,第一个版本叫做Grace-Hopper,是"CPU+GPU结合体,使用NVLink技术连接,带宽高达900GB/s。

而名为"Grace CPU超级芯片"的版本则由两个CPU芯片封装组成,它们之间通过NVLink-C2C连接。整个超级芯片总计144个CPU内核(基于ARMv9指令集),缓存容量396MB,支持LPDDR5X ECC内存,带宽高达1TB/s。

英伟达GTC大会出王炸,黄仁勋怀揣核弹级CPU、GPU及最强AI来袭

这被黄仁勋称作“AI工厂的理想CPU”。

据介绍,Grace Hopper超级芯片模组能在CPU与GPU之间进行芯片间的直接连接,其关键驱动技术是内存一致性芯片之间的NVLink互连,每个链路的速度达到900GB/s。

Grace CPU超级芯片也可以是由两个CPU芯片组成。它们之间通过高速、低延迟的芯片到芯片互连技术NVLink-C2C连在一起。

这很难不让人联想到苹果刚发的M1 Ultra,看来片间互连技术的进展,让“拼装”成了芯片行业一大趋势。

Grace超级芯片在SPECrate2017_int_base基准测试中的模拟性能达到了740分,是当前DGX A100 搭载的CPU的1.5倍(460分)。

Grace超级芯片可以运行在所有的NVIDIA计算平台,既可作为独立的纯CPU系统,也可作为 GPU加速服务器,利用NVLink-C2C技术搭载一块至八块基于Hopper架构的GPU。

Grace CPU超级芯片可运行所有的英伟达计算软件栈,结合英伟达ConnectX-7网卡,能够灵活地配置到服务器中,或作为独立的纯CPU系统,或作为GPU加速服务器,可以搭配1块、2块、4块或8块基于Hopper的GPU。

也就是说,用户只维护一套软件栈,就能针对自身特定的工作负载做好性能优化。

黄仁勋说,Grace超级芯片有望明年开始供货。

AI方面,如今英伟达已经能提供全栈AI,除了AI计算硬件外,其AI软件也有不少进展。

黄仁勋说,AI已经从根本上改变了软件的能力以及开发软件的方式,过去十年,英伟达加速计算在AI领域实现了百万倍的加速。

在本届GTC大会上,英伟达发布了60多个针对CUDA-X的一系列库、工具和技术的更新,以加速量子计算和6G研究、网络安全、基因组学、药物研发等领域的研究进展。

英伟达将使用其首台AI数字孪生超级计算机Earth-2来应对气候变化挑战,并创建了Physics-ML模型来模拟全球天气模式的动态变化。

英伟达认为,工业上同样能通过在虚拟环境中模拟的方式,来增加AI训练的数据量,换而言之就是“在元宇宙里搞大训练”。

例如,让AI智能驾驶在元宇宙里“练车”,利用仿真出来的数据搞出半真实环境,增加一些可能突发故障的环境模拟:

英伟达GTC大会出王炸,黄仁勋怀揣核弹级CPU、GPU及最强AI来袭

除了数字孪生,数字资产的生产也是元宇宙早期建设阶段需要着重考虑的部分。

在这方面,英伟达推出了随时随地能在云端协作的Omniverse Cloud。

黄仁勋认为,第一波AI学习是感知和推理,下一波AI的发展方向是机器人,也就是使用AI规划行动。英伟达Omniverse平台也正成为制造机器人软件时必不可少的工具。

英伟达GTC大会出王炸,黄仁勋怀揣核弹级CPU、GPU及最强AI来袭

作为虚拟世界的仿真引擎,Omniverse平台能遵循物理学定律,构建一个趋真的数字世界,可以应用于使用不同工具的设计师之间的远程协作,以及工业数字孪生。

黄仁勋认为,工业数字孪生需要一种专门构建的新型计算机,因此英伟达打造了面向工业数字孪生的OVX服务器和OVX SuperPOD超级集群。

Venturebeat对此评价称,“这些案例给元宇宙赋予了真正的意义”。

最后,黄仁勋再次派出自己的虚拟数字人化身“玩偶老黄”Toy Jensen,并跟这个表情生动的玩偶进行了一番流畅的实时问答对话。

英伟达GTC大会出王炸,黄仁勋怀揣核弹级CPU、GPU及最强AI来袭

(校对/Arden)

继续阅读