天天看点

东数西算催生算力革命,“芯基建”与背后的“XPU”们

东数西算催生算力革命,“芯基建”与背后的“XPU”们

集微网消息,自“东数西算”工程启动以来,“东数西算”便成为了高频热词,而其背后将是一场“算力革命”。

2022年开年,国家发改委、中央网信办、工信部、国家能源局联合发文同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏启动建设国家算力枢纽节点,初步阶段规划10 个国家数据中心集群。全国一体化大数据中心体系完成总体布局设计,“东数西算”由此正式启动。

进入算力新时代

近年来,随着各行业数字化转型升级进度加快,全社会数据总量爆发式增长。目前大陆数据中心大多分布在东部地区,土地、能源等资源日趋紧张。而西部地区资源充裕具备发展数据中心、承接东部算力需求的潜力。

“东数西算”通过构建数据中心、云计算、大数据一体化的新型算力网络体系,将东部算力需求有序引导到西部,优化数据中心建设布局,促进东西部协同联动。

长期来看的话,东数西算的正式启动意味着中国进入算力新时代。截至目前,大陆数据中心规模已达500万标准机架。随着数字技术向经济社会各领域全面持续渗透,全社会对算力需求仍十分迫切。

此前发改委表示,实施东数西算工程,有利于提升国家整体算力水平。通过全国一体化的数据中心布局建设,扩大算力设施规模,提高算力使用效率,实现全国算力规模化集约化发展。

由于东数西算主要是加强西部数据中心建设,来缓解东部数据中心压力。在此过程中,芯片是其中不可或缺的基础性支撑一环。

“东数西算”中的“数”,指的是数据,“算”指的是算力,即对数据处理的能力。而数据中心可以分为“计算”“存储”和“网络”三大元素。因此,这三大核心功能所需要的芯片,成为“东数西算”战略下产业关注的焦点。在此背景下,“国产芯”有望迎来新一轮需求增长。

今年2月,中国移动发布PC服务器集采数据,华为鲲鹏芯片服务器占比16.55%,海光芯片服务器占比10.49%。近日,中国电信2022-2023年服务器集中采购项目开标,本次集采是迄今为止国内三大运营商最大规模服务器集采项目之一,国产CPU占比27%。

多方观点认为,东数西算将集中建设大规模的数据中心集群和算力网络,直接拉动服务器芯片、AI芯片、DPU、GPU等数据中心异构加速芯片的巨大需求。

“XPU”筑牢大算力“芯基建”

算力进一步细分,可以分为三个不同类型。

第一种叫基础算力,这是由基于CPU芯片的服务器提供的算力,主要用于基础通用计算。我们常提到的云计算、边缘计算等,都属于基础算力。

第二种叫智能算力,这是由基于GPU、FPGA、ASIC等AI芯片的加速计算平台提供的算力,主要用于人工智能的训练和推理计算,比如语音、图像和视频的处理。

第三种叫超算算力,这是由超级计算机提供的算力,主要用于尖端科学领域的计算,比如行星模拟、药物分子设计、基因分析等等。

“东数西算”作为落实数字经济国家战略的重要一步。从数据的产生到数据的传输、计算、处理,都离不开计算芯片。由于数据处理量提升反向刺激数据处理速度,CPU、GPU等高性能计算芯片需求有望持续提升。

从物理结构上看,GPU和CPU相似,包括控制单元、存储单元及运算单元,但CPU擅长于逻辑控制和串行计算,而GPU拥有更多的ALU,适合大规模数据的并行处理,适配深度学习等算法的数据处理需求。根据IDC,2021年AI服务器加速器中GPU占91.9%,NPU占6.3%,ASIC占1.5%,FPGA占0.3%。

IDC数据显示,中国GPU市场规模2020年为26亿美元,2024年将达到64亿美元,复合增长率达30%。而在市场需求的推动下,热钱也在迅速涌入GPU行业,助推大陆GPU企业进一步高速发展。

仅在今年前三月,大陆GPU赛道中就已完成多轮大额融资,砺算科技完成数亿元天使轮融资,用于研发天图GPU芯片;GPU厂商芯瞳半导体完成Pre-A轮融资; GPU企业深流微智能完成近亿元PreA轮融资。

而在东数西算进一步炒热的基础软件和IDC等细分领域中,DPU因其特性被广泛看好。

DPU被定义为数据处理器,核心是通过协处理器协助主控CPU处理网络、存储以及计算等功能,为高带宽、低延迟、数据密集的计算场景提供计算引擎,有望成为数据中心场景中继CPU和GPU之后的第三大算力支柱芯片。

目前,国内DPU行业已开始涌现出一批本土初创企业,东数西算工程的实施也会对整个DPU产业产生良好的促进作用。面对已经到来的算力增长时代,大陆DPU企业也开启“融资热”,今年3月,芯启源获超亿元战略投资,用于下一代DPU产品研发。纵观过去一年,中科驭数、大禹智芯、星云智联、益思芯科技等皆获得融资,助推企业进一步成长。

全国人大代表、宁夏回族自治区工信厅党组副书记、副厅长万新恒指出,“东数西算”之后便是“芯云融合”。DPU等处理芯云融合解决方案,最直接的作用是作为CPU的卸载引擎,接管网络虚拟化、硬件资源池化等基础设施层服务, 从而释放宝贵的CPU资源来运行上层应用,实现了以数据为中心的业务和基础设施操作的分离,进而降低网络数据对数据中心的依赖,缓解东部应用端对网络数据的处理需求,让数据中心真正回归数据计算,解决供需失衡问题。(校对/西农落)

继续阅读