天天看点

英伟达GPU微架构。前Synopsys研发,十年数字芯片架构师,告诉你:为什么英伟达就是英伟达那么好?当然是人家硬件是基

作者:Huliangliang

英伟达GPU微架构。

前Synopsys研发,十年数字芯片架构师,告诉你:为什么英伟达就是英伟达那么好?当然是人家硬件是基础了,其次是他们家软件也非常的有市场竞争力。具体到AI GPU从底层往上讲,因为最底层就是运算单元、单元、堆叠成多线程层的微架构、多线程层的微架构。堆叠好了以后再把它摆成阵列,这样就一层一层积木搭起来,就是想要的爆发性工艺。

上一篇我讲到先进工艺可以把频率升得很高,把功耗降得很低,所以它的性价比就非常高。具体到AI GPU就是从微架构上看,它跟CPU不太一样的地方在于什么?它其实是一个多输入多输出的模型,在做运算的时候一定都是流水线结构。

但是因为想做这种单指令多数据的操作,就是在同样一个指令下,它有一个模型叫做:MD就是single instryc。我做一个指令,可以执行数据的阵列,把它复制成二维的模型,就是在做一个指令操作的时候可以有多个数据通道同时在工作,就是把CPU的单线程操作变成了多线程操作。这就是multi-thread基本的原理。

multi-thread以后还要加强流水的能力,多线程并行操作。群里好多专业的小伙伴,是的,很开心。我问你个问题,把它变成多线程输入?不同的线程之间就会有时差,其实是这样的,在并发操作的时候,当然不同的线程之间会有所谓的 store-cy口就是有气泡,这个一定是存在的。

但是整体来讲考虑的是吞吐量的问题,吞吐量在多线程的时候是会被抬上去的。其实你问的是流水的问题,单线程也存在;同样的问题单传程就没有流水的问题,一样会有气泡的。就好比一个水龙头在流水吗?流得怎么样流得快?那可一定是满载,不停得在流。如果它中间不停地有blingbling肯定就慢了。

英伟达GPU微架构。前Synopsys研发,十年数字芯片架构师,告诉你:为什么英伟达就是英伟达那么好?当然是人家硬件是基
英伟达GPU微架构。前Synopsys研发,十年数字芯片架构师,告诉你:为什么英伟达就是英伟达那么好?当然是人家硬件是基
英伟达GPU微架构。前Synopsys研发,十年数字芯片架构师,告诉你:为什么英伟达就是英伟达那么好?当然是人家硬件是基
英伟达GPU微架构。前Synopsys研发,十年数字芯片架构师,告诉你:为什么英伟达就是英伟达那么好?当然是人家硬件是基

继续阅读