为了您更好的阅读互动体验,为了您及时看到更多内容,点个“关注”我们每天为您更新精彩故事、分享不一样的故事瞬间
在全球技术领域,一个引人注目的争议正在占据头条新闻:传统的图形处理器(GPU)在人工智能(AI)的应用中逐渐显露出其局限性。这一发现首先在加拿大和美国的一些创新企业中引起了广泛的关注,它们正致力于开发出能够替代传统GPU的新型半导体技术。这些企业的目标不仅是创造更加高效的AI计算平台,而且是直接挑战占据GPU市场约80%份额的行业巨头——美国的英伟达。
半导体领域的新探索
长期以来,GPU被广泛应用于游戏领域,其设计主要是为了处理高清图像。然而,随着生成式AI的兴起,GPU在这一新领域的电力消耗问题变得日益突出。这一挑战促使了对于新型半导体技术的探索和开发,特别是那些专为生成式AI设计的半导体。这些新兴企业的目标是开发出既能高效运行AI应用,又能显著减少能源消耗的半导体技术。
跨国合作的新动向
一场重要的转变正在悄然发生:日本RAPIDUS公司的社长小池淳义于11月宣布,他们将与加拿大的TENSTORRENT公司合作,这标志着他们迈出了开拓新型AI半导体市场的第一步。这次合作的重点是开发和生产适用于AI运算的新型半导体。TENSTORRENT的首席执行官吉姆·凯勒,一个在硅谷享有盛誉的半导体工程师的加入,为这次合作增添了更多的期待和可能性。
半导体界的传奇人物
吉姆·凯勒,曾在苹果、特斯拉和AMD等知名美国企业任职,参与设计了多款主力半导体。他在硅谷的声誉如同传奇一般,被业界广泛认为是“半导体工程师中的传奇人物”。小池淳义对凯勒的加入给予了极高的评价,认为这对整个行业来说具有重大的意义。
技术革新的新篇章
RAPIDUS计划在其位于北海道千岁市的新工厂中,于2025年开始生产由TENSTORRENT设计的AI半导体。这一举措旨在模仿过去英伟达与台积电(TSMC)之间的成功合作模式,力图在分工体制的基础上实现技术上的飞跃。对于RAPIDUS和TENSTORRENT来说,这不仅是一次技术上的合作,更是开启半导体技术新纪元的重要一步。
GPU的局限性
长期以来,GPU以其擅长处理大量数据的并行计算能力而著称。然而,它们最初是为游戏图像处理设计的,而不是为AI计算优化。这就导致了在作为生成式AI基础的数据中心服务器中,GPU存在明显的弱点。其中,最大的问题是电力效率低下。GPU的设计中,运算器和存储器的分离导致了在数据交换过程中的高能耗,而这并不是运算本身所必需的。
电力效率的新解决方案
在这一挑战中,TENSTORRENT正在开发一种新型的AI半导体,这种半导体通过将运算器和存储器位置靠近,缩短了数据的移动距离,从而减少了电力的浪费。凯勒形象地比喻说,在AI运算中,运算器之间的直接对话,将运算结果直接传递到下一个运算,是一种非常自然的处理方式。
开放源代码的采用
在半导体运行的“指令集”方面,英伟达采用了英国ARM的技术,而TENSTORRENT则选择了开放源代码的“RISC-V”。这样做的目的在于控制授权费用,同时也为了根据客户需求灵活改变半导体的设计。凯勒指出,对于那些希望开发价值数百万日元机器人的企业来说,数百万日元的GPU显得过于昂贵。因此,TENSTORRENT正努力开发在价格方面能与英伟达竞争的新一代AI半导体。
推理运算的新趋势
随着生成式AI的发展,开发企业将大量运算资源用于提高“学习”阶段的精度。而在未来,随着诸如CHATGPT等服务的普及,AI输出问题答案的“推理”运算可能会消耗更多的电力。这一趋势催生了一批专注于改善GPU问题的初创企业,例如D-MATRIX和RAIN AI。
内存运算技术的新兴企业
D-MATRIX由英特尔出身的CEO SID SHETH于2019年创立,专注于使用一种让存储器具备运算功能的“内存运算”技术,以减少数据中心服务器在推理运算中的电力消耗。从D-MATRIX计划于2024年开始供货的AI半导体“CORSAIR”来看,其运算量和速度都远超英伟达的主力GPU。
中国市场的新动向
英伟达长期以来在中国市场占有重要地位,中国一直是其最大的市场之一。然而,随着美国对高端GPU芯片的出口限制,英伟达不得不为中国市场推出了性能降低的特供版产品。这一策略引发了广泛的讨论,许多中国企业开始转向国产GPU芯片,或选择大厂的AI云服务,减少对英伟达产品的依赖。
中国AI芯片的崛起
中国的AI芯片行业正在迅速崛起,众多本土企业如阿里巴巴的平头哥正在开发专用AI处理器,以替代英伟达的AI芯片。这种趋势表明,中国市场对于AI芯片的需求正在逐步转向国产解决方案,减少对外国技术的依赖。这不仅体现了中国技术自给自足的战略转变,也反映了全球技术市场日益多元化的趋势。