天天看点

英伟达正在研究各种多芯片GPU设计方案,可根据不同工作负载做针对性组合

英伟达下一代将面向数据中心和消费市场,分别推出基于Hopper架构和Ada Lovelace架构的GPU。有所不同的是,英伟达只在Hopper架构GPU上采用MCM多芯片封装,Ada Lovelace架构GPU仍会保留传统的设计,并不会像AMD基于RDNA 3架构的Navi 31那样,将MCM多芯片封装引入到消费级GPU。

英伟达正在研究各种多芯片GPU设计方案,可根据不同工作负载做针对性组合

近期,英伟达研究人员发表了一篇文章,详细介绍了英伟达正在探索如何为未来产品部署多芯片设计方案。随着异架构计算的兴起,英伟达正在寻找一种方法,增加其半导体设计的灵活性,以根据工作负载的不同,灵活匹配各种模块,这也是MCM多芯片封装的用武之地。

英伟达对多芯片设计的研究最早是在2017年被曝光,当时英伟达展示了通过四个小芯片构建的设计方案,不但提升了性能,还有助于提高产量(较小的芯片良品率会提高),而且还允许将更多的计算资源集合在一起。多芯片设计还有助于提高供电效率,以及有更好的散热效果。

英伟达目前在MCM多芯片封装GPU上的做法称为“Composable On Package GPU”,或COPA。文章里阐述了英伟达如何处理HPC和AI工作负载之间的差异,随着两者计算需求的变化,对计算的要求也渐行渐远。英伟达担心,过于单一的GPU架构,会逐渐失去HPC和AI工作负载中的计算优势,而两者的市场规模却在日益增长。

英伟达正在研究各种多芯片GPU设计方案,可根据不同工作负载做针对性组合

为了更好地应对未来的计算需求,英伟达一直在模拟不同的多芯片设计和配置,确认不同工作负载所需要的硬件模块情况。根据英伟达提供的数据,在HPC工作负载上,减少25%的显存带宽实际上只降低了4%的性能,如果再减少25%,性能损失则再增加10%。因此,减少50%的显存带宽并移除相关硬件模块后,可以替换成更合适的硬件模块,为对应的工作负载提供相应的性能,从而提高效率。由于并不是所有硬件模块都是对等的,个别功能是不可或缺的,COPA是英伟达尝试模拟多芯片设计的影响,以及与性能之间的关系。

英伟达目前优先考虑的是HPC和AI市场,除了高利润的因素以外,不少企业通过定制解决方案的做法逐渐蚕食着英伟达的市场空间。当然,这种根据工作负载做针对性配置的做法也可以应用与英伟达其他GPU产品线,包括消费市场的GeForce显卡。不过与专业市场不同,游戏中的渲染工作方式有着本质上的区别,如果采用多芯片设计,则需要进一步提高小芯片之间的互联速度。

英伟达正在研究各种多芯片GPU设计方案,可根据不同工作负载做针对性组合

此前AMD已谈及了其3D堆栈技术的发展方向,表示封装选择和芯片架构取决于具体产品的性能、功率、面积和成本,AMD称之为PPAC。如果将已经发布和即将推出的产品包括在内,AMD有14种多层小芯片设计的封装架构正在进行中。AMD认为,未来属于多芯片的模块化设计和匹配协调的封装。

AMD已通过X3D封装的产品迈出了第一步,在CPU上展示了对成本、功耗和性能等方面的影响。在GPU上采用同样的设计会更为困难,不过技术的发展最终会推动英伟达实现多芯片设计的目标,即由多个不同功能模块的小芯片组成GPU,可以根据工作负载的计算需求做出更专业化的组合。

继续阅读