天天看点

性能暴降92%!英特尔向中国市场推出两款“特供版”AI芯片【附全球人工智能芯片行业现状分析】

作者:长江云
性能暴降92%!英特尔向中国市场推出两款“特供版”AI芯片【附全球人工智能芯片行业现状分析】

(图片来源:摄图网)

英特尔(Intel)最近在官网上发布了一份名为“Gaudi 3 AI加速器白皮书”的报告,揭示了他们即将在中国发售

Gaudi 3

两款“特供版”AI芯片产品。这两款硬件形态加速卡分别是型号为HL-328的OAM兼容夹层卡(Mezzanine Card)和型号为HL-388的PCle加速卡,预计将于今年6月24日和9月24日推出。

据报道,原版Gaudi 3在FP16/BF16上的性能可以达到1835 TFLOPS,而中国特供版Gaudi 3的16bit性能将不超过150 TFLOPS。相比国际版Gaudi 3,中国特供版的HL-328芯片性能或将降低约92%左右。这意味着中国特供版Gaudi 3的TDP(热设计功耗)也将大幅降低。

Gaudi 3在AI加速领域的强大性能和效率,尤其在大模型训练和推理方面表现出色。国际版Gaudi 3拥有128GBHBMe2内存容量、3.7TB内存带宽和96MB板载静态随机存取内存,可以满足大模型的超大内存需求。而Gaudi 3的训练时间平均比英伟达的H100缩短了50%。在Llama-2 7B/70B以及Falcon180B大模型的推理测试中,Gaudi 3的吞吐量平均比H100快了50%,平均推理效率快了40%。

人工智能芯片发展路径

人工智能作为一项计算密集型的新技术,在早期发展阶段依赖通用芯片的性能迅速发展,而后期将依赖专用芯片来主宰市场。定制的硬件能够实现更优的功耗效率,满足不同算法、结构、终端和消费者的需求,实现规模化的收益。然而,通用芯片与专用芯片永远不是互相替代的关系,二者必须协同工作才能发挥出最大的价值。

性能暴降92%!英特尔向中国市场推出两款“特供版”AI芯片【附全球人工智能芯片行业现状分析】

人工智能芯片分类

目前,人工智能芯片根据技术架构可分为CPU、GPU、FPGA、ASIC和类脑芯片;根据在网络中的位置可分为云端AI芯片、边缘AI芯片和终端AI芯片;按实践目标可分为训练芯片和推理芯片。

性能暴降92%!英特尔向中国市场推出两款“特供版”AI芯片【附全球人工智能芯片行业现状分析】

全球GPU芯片出货量超过4.6亿片/年

GPU是目前市场上应用最广泛、在AI计算方面最成熟的通用芯片。根据弗若斯特沙利文的推算,2020年GPU芯片在AI芯片市场占据了35.95%的主要份额。

近年来,全球GPU技术迅速发展,不仅满足了传统图形应用需求,还在科学计算、人工智能和新型图形渲染技术方面得到广泛应用。这些技术的成熟应用推动了全球GPU芯片市场的持续高速发展。据全球知名调研机构JPR的数据显示,2021年全年全球GPU芯片的出货总量超过4.6亿片,每个季度的出货量维持在1-1.3亿片之间。

性能暴降92%!英特尔向中国市场推出两款“特供版”AI芯片【附全球人工智能芯片行业现状分析】

根据IDC的预测,随着智能手机需求逐步复苏以及对AI芯片的强劲需求,半导体市场将在2024年重新回到增长趋势,年增长率预计将超过20%。

另据Omdia的预测,全球机器人人工智能芯片组市场规模预计将达到8.66亿美元,这将有助于推动GenAI在机器人领域的普及化。

IDC亚太区半导体研究高级研究经理Galen Zeng指出,内存芯片制造商对供应和产量的严格控制导致芯片价格自去年11月初开始上涨。预计人工智能的需求将推动2024年整体半导体销售市场的复苏。

前瞻经济学人APP资讯组

更多本行业研究分析详见前瞻产业研究院《全球人工智能芯片(AI芯片)行业市场调研与发展前景研究报告》

同时前瞻产业研究院还提供产业大数据、产业研究报告、产业规划、园区规划、产业招商、产业图谱、智慧招商系统、行业地位证明、IPO咨询/募投可研、专精特新小巨人申报等解决方案。在招股说明书、公司年度报告等任何公开信息披露中引用本篇文章内容,需要获取前瞻产业研究院的正规授权。

更多深度行业分析尽在【前瞻经济学人APP】,还可以与500+经济学家/资深行业研究员交流互动。更多企业数据、企业资讯、企业发展情况尽在【企查猫APP】,性价比最高功能最全的企业查询平台。

继续阅读