国产GPU，如何追平5年的技术差距

作为AI时代革命核心的硬件，GPU国产化之路注定崎岖。

图片来源 I pixabay

人工智能AI或将改变人们的生产和生活方式，甚至影响人类对自身、社会和世界的认知。

目前AI重点研究的领域包括自然语言处理、机器人、语言识别等，围绕这些领域的竞争日益激烈，产业生态体系也日趋成熟，中国的人工智能产业迎来了前所未有的发展机遇。IDC《中国半年度加速计算市场（2022下半年）跟踪》报告显示，2022年加速服务器市场规模达到67亿美元，同比增长24%。其中，GPU服务器依然是主导地位，占据89%的市场份额，达到60亿美元。同时NPU、ASIC和FPGA等非GPU加速服务器以同比12%的增速占有了11%的市场份额，达到7亿美元。IDC预测，到2027年中国加速服务器市场规模将达到164亿美元。其中非GPU服务器市场规模将超过13%。

图注：在2022年中国人工智能芯片市场中，GPU占据主导地位

GPU原本专为游戏和多媒体等复杂的图像和视频处理应用而设计，同样适用于数据密集型深度学习任务，快速处理大量数据并生成有用的结果，其运算能力对于需要同时执行数百万次数学计算的大规模机器学习和深度学习模型至关重要，可以被用于实时决策和自动驾驶汽车、个性化医疗和自然语言处理等高级应用。

解锁AI应用的关键

为什么是GPU？

GPU在AI深度学习和神经网络中的应用已经得到运用，以GPT-3自然语言处理（NLP）模型为例，在训练和测试时都需要大规模的计算资源支持，通常需要使用成千上万个GPU。

相比CPU、FPGA、ASIC等其他类型芯片，为什么GPU更加适合人工智能，与专门设计用于人工智能的DPU、NPU相比，GPU又具备哪些优势？主要是GPU具有以下特点：

并行计算能力强。GPU具备数千个核心，这些核心可以同时处理不同的任务，使得GPU能够支持巨大的计算工作负载，并在短时间内完成运算，提高了深度学习和神经网络的训练效率。相比于CPU、FPGA、ASIC等其他芯片，GPU不仅能够同时完成多个任务，而且处理大量数据的速度更快。GPU的执行速度大约是CPU的20-100倍。

高带宽和大存储空间。GPU为深度学习和神经网络提供了高带宽的内存访问，这使得它们能够处理大量的数据并支持模型训练。GPU还提供了大存储空间，确保了大量数据集在训练期间的存储能力。

灵活性。相比于专门设计用于AI的DPU和NPU，GPU可以运行各种类型的模型训练，例如深度神经网络、卷积神经网络等等，这使得GPU具有更高的灵活性，适用于更广泛的应用场景。虽然专门设计用于AI的DPU和NPU能够提供更高的精度，但是它们通常只能运行特定类型的神经网络，因此相比之下GPU更加灵活。

GPU的差异化主要集中在以架构和整理能力。以NVIDIA的GPU为例，其产品和其他厂商相比，领先之处在于GPU架构的设计方式不同，在显存调度方面，NVIDIA的GPU拥有更加强大、智能的显存调度器，可以更好的利用显存的带宽和存储空间，在处理复杂的计算任务时更加高效。同时，NVIDIA也有许多自主研发的技术，例如CUDA核心技术和Tensor Cores技术，以及采用异构计算模式和整合GPU、CPU等架构的理念，这样可以更好地发挥GPU在计算中的优势。

此外，在芯片的设计和制造过程中，NVIDIA也采用了更为先进、精细的制造工艺，例如使用TSMC7nm工艺，Ampere系列GPU可以提供更高的集成密度和效率。同时，NVIDIA还在硬件、软件和智能化方面进行了深入的研发和优化，这使得其GPU在处理人工智能、图形渲染等大型计算领域的性能优势更加明显。

需求涌现

GPU价格水涨船高

深度学习、图像识别和语音识别等领域都需要大量GPU，GPU供应量并没有跟随这种需求的增长而同步增长，因为GPU的制造过程比CPU更为复杂，需要更多投资和技术支持，GPU厂商并不能快速地增加产能，导致市场供应紧张。

深度科技研究院院长张孝荣介绍，“国产GPU发展较晚，市面产品大多属于低端产品，主要用于商用机或服务器领域，个人消费级产品很少，技术水平距离国外巨头当前的水平约有五年。”国产化叠加AI计算需求日益扩大，国产GPU未来会有更大的发展空间，AI大模型的热潮促进了GPU市场的活跃，国外先进GPU价格昂贵供不应求，国产GPU也得到了国内厂商的一部分订单，市场份额逐渐扩大。

图注：国际知名科技作家陈根

国际知名科技作家陈根提到：“ChatGPT背后的大模型需要大量GPU的支持，这也导致了GPU价格的上涨。未来，随着需求的不断增加，GPU供需关系也将发生变化。预计GPU价格会继续上涨，但同时也会有更多的GPU厂商进入市场，从而增加供给。总的来说，国内GPU厂商虽然目前处于较为落后的水平，但在人工智能领域仍有着广阔的发展前景。未来，GPU价格和供需关系也将发生变化，市场将更加竞争激烈，消费者也将有更多的选择。”

国产化

研发符合需求的GPU

在GPU芯片市场，大陆GPU领域的企业短期内仍然以消费类应用为主，面向未来，发展人工智能和GPU产业具有重要意义，只有通过集中研发力量来不断提升产品性能、不断推出新产品，才能在激烈的全球市场竞争中占据先机。

图注：中国民营科技实业家协会元宇宙工作委员会秘书长吴高斌

中国民营科技实业家协会元宇宙工作委员会秘书长吴高斌表示：“目前国产的GPU，最好的性能大概能到NVIDIAA10070%左右的性能，如果再考虑性能在使用过程中的衰减情况，差距会更大一些，短时间之内要想赶超NVIDIA与AMD还不现实。对于国产GPU的厂商而言，最直接的机会就是产品需要快速放大。”

他认为，GPU国产化不是一个可选项的问题，是没有选择的问题。基于这一点，本土GPU厂商面对绝佳发展机遇，国内市场提供了许多应用的场景以及性能优化的实战条件，对于研发优化会有很大的帮助。短时间对于国厂GPU需求的放大，会造成供需波动，必然会引发产品价格的上涨。但对于本土GPU厂商而言，目前必须要留意的是不要盲目扩大产能，而是要集中研发力量来优化产品性能。同时也要看到，海外GPU厂商目前仍能为中国市场提供减配版GPU，一旦这种产品能尝试成功的话，一些大厂还会优先选择减配版，至少性能更稳定。

在实际应用中，本土GPU厂商可针对国内市场的需求，加大在追踪本土GPU用户需求方面的投入，使得本土GPU产品有更好的适应性和用户体验，从而形成市场竞争力。在成本上，国际知名GPU厂商通常面临采购及远程运输等成本的影响，而作为本土生产商，成本更可以得到更好的控制及降低。

通常来说，GPU的需求主要考察几个指标，包括：

工作负载。根据你所需要完成的任务的类型和规模来选择GPU型号。如果你需要处理大规模的数据，那么你可能需要拥有一款具有更高内存容量和处理速度的GPU。

芯片性能。在比较GPU产品的性能时，需要关注芯片的实际性能，而不只是简单的GPU型号或内存容量。比如，同样是8GB内存的GPU，但是一款实际性能更好的显卡可能比另一款内存更大的显卡更适合你的工作负载。

成本。尽管高性能GPU在处理大规模数据时效率更高，但是成本也更高昂。如果你无法承受高成本，那么需要寻找一款价格适中，在性能和成本之间找到平衡点的GPU产品。

兼容性。在使用GPU时需要考虑其硬件和软件的兼容性。因此，需要确保所选GPU与你的系统和软件相兼容。

中国数实融合50人论坛智库专家洪勇说道：“国内GPU厂商有机会在人工智能领域进行技术创新。他们可以利用本土市场的需求和行业特点，推动硬件和软件的创新，提供更加适用于人工智能任务的高性能GPU产品。大陆拥有庞大的人工智能市场和应用需求，包括机器学习、深度学习、自然语言处理等领域。国内GPU厂商可以通过提供适应本土需求的产品和解决方案，满足人工智能应用的需求。”此外他还提到，政府对人工智能领域的支持力度较大，包括政策扶持、资金投入等方面，这有助于加快技术研发和市场推广。

政策在本土GPU获取市场份额过程中可以起到许多作用，相关政策和规定支持本土GPU生产商和相关产业的发展，鼓励本土企业进行技术创新和研发。资金支持和优惠政策帮助本土GPU生产商开展生产、研发和推广工作，促进产业的快速发展。市场监管及质量监控体系保障本土GPU产品的质量与稳定性，对市场进行研究及管理。官方层面积极推广本土GPU产品，为本地厂商开辟更多的国内市场，提高本土GPU产品在国内市场的知名度和市场份额。

小结

总的来说，GPU在人工智能领域的应用正在变得越来越广泛，在加速深度学习、图像识别、语音处理等任务方面发挥着非常重要的作用。由于深度学习需要大量的计算资源，GPU在深度学习的应用中被广泛使用，同时，随着深度学习技术的不断发展，GPU的性能和速度也在不断提高。