天天看点

千呼万唤始出来 英特尔公布全新至强产品路线图

英特尔上一次更新路线图还是去年。

但去年的7月份更新的是工艺路线图,具体来说,就是原10ESF改名7nm,原7nm改名4nm,7SF改名3nm,5nmGAA改名20A。在当时也表示Intel 7将用于Alder Lake消费级处理器和Sapphire Rapids数据中心处理器,目前Alder Lake消费级处理器已经正式推出,而在服务器这边,对于Sapphire Rapids之后的路线图,英特尔在当时还没给出确切的安排。

不过在最近的2022年投资者大会上,英特尔首次披露了2022-2024年的全新英特尔至强产品路线图。英特尔不仅将在数据中心产品线中新增一个代号为Sierra Forest的超高能效处理器系列,把关键产品提升至更先进的制程工艺,也为数据中心制定了一个更新和更全面的架构策略,从而在进一步增强英特尔在业界整体领导力的同时,通过全新的下一代产品推动自身在云、网络和边缘领域的持续增长。

英特尔执行副总裁兼数据中心与人工智能事业部总经理Sandra Rivera表示:“今天,我们清晰地展示了行业领先的英特尔至强产品路线图,这将持续推动我们在2024年及以后的发展并全面增强英特尔在业界的领导地位。基于客户的多元化需求和时间规划,我们携手客户打造了丰富的产品组合,这也将通过客户的开发者生态系统推动进一步创新。”

千呼万唤始出来 英特尔公布全新至强产品路线图

全新的架构和领先的产品路线图

面向未来几代至强处理器,英特尔制定了全新的架构策略——即同时拥有基于性能核(P-core)和能效核(E-core)的双轨产品路线图,以将两个优化的平台整合为一个通用、定义行业发展的平台。该全新架构策略将更大限度地增强产品的每瓦性能和细分功能,从而全面增强英特尔在业界的整体竞争力。在采取新策略的同时,英特尔也进一步增强了与现有广泛的至强平台生态系统的兼容性,以为用户带来更好的投资收益。

Sapphire Rapids:对于采用Intel 7制程工艺制造的性能核系列,英特尔主要围绕Sapphire Rapids展开了分享。Sapphire Rapids是迄今为止英特尔功能最丰富的至强处理器,增强了其在人工智能、安全性等几大关键数据中心领域的领导地位。3月,英特尔将开始逐步出货Sapphire Rapids处理器,并通过DDR5、PCIe 5.0和全新Compute Express Link高速互连的标准技术引领整个行业向下一代内存和接口标准过渡。

具体来看,Sapphire Rapids的核心是一个分区块、模块化的SoC架构,采用英特尔的嵌入式多芯片互连桥接(EMIB)封装技术,支持加速器接口架构指令集、高级矩阵扩展,以及数据流加速器,能够提供更高的整体工作负载性能。

Sapphire Rapids的黑科技不止于此,我们已经在第三代至强可扩展处理器上看到了其在AI方面的无限潜力,而Sapphire Rapids则更进一步,通过集成英特尔高级矩阵扩展AMX加速IP模块,可以为深度学习算法核心的Tensor处理提供大幅加速。具体来说,Sapphire Rapids可以在每个周期内进行2000次INT 8运算和1000次BFP 16运算,相比AVX-512指令集实现了相当可观的能效比提升,可大幅提升AI工作负载中的训练和推理性能。

除此之外,Sapphire Rapids也集成了英特尔加速器接口架构指令集AIA和英特尔数据流加速器DSA,前者可以实现对加速器和设备的有效调度、同步和信号传递,而后者可以卸载最常见的数据移动任务,改进对这些开销任务的处理,以提供更高的整体工作负载性能,并可以在CPU、内存和缓存以及所有附加的内存、存储和网络设备之间移动数据。

Emerald Rapids:英特尔将在2023年交付采用Intel 7制程工艺制造的下一代性能核处理器Emerald Rapids。该处理器的插槽将兼容Sapphire Rapids,并在提升性能的同时增强现有平台在内存和安全性方面的优势,为英特尔客户提供易于使用且极具价值的升级产品。

Sierra Forest:作为本次新策略的重要部分,英特尔首次披露了Sierra Forest的详细信息。这是一款数据中心基于能效核的新型至强处理器,它将提供极高的每瓦性能和超高密度,同时能够大幅降低总体拥有成本。该款产品计划于2024年推出,将采用针对云工作负载进行专门优化的内核而构建的解决方案,专为满足英特尔超大规模客户的需求而设计。

Granite Rapids:基于对Intel 3制程工艺的信心,英特尔宣布将Granite Rapids处理器的制造工艺从Intel 4提升至Intel 3。这款基于性能核的下一代至强处理器计划于2024年问世,将进一步加强英特尔在业界的整体领导力。

千呼万唤始出来 英特尔公布全新至强产品路线图

第三代英特尔至强可扩展处理器的强劲发展势头

在通过全新的数据中心产品路线图展示未来创新的同时,英特尔也强调了当前第三代英特尔至强可扩展处理器(Ice Lake)的强劲发展势头,该处理器主要针对现代工作负载进行优化。英特尔已向全球客户出货了近200万片第三代英特尔至强可扩展处理器,仅在2021年第四季度其出货量就已经超过100万。此外,英特尔至强处理器在2021年12月的总出货量超过了行业内同类单家厂商在2021年全年的服务器CPU总出货量。

第三代至强可扩展处理器的主要技术亮点体现在SGX英特尔软件防护扩展技术和AI加速能力。与常规的隐私保护或者安全技术相比,SGX在安全性、性能和可用性方面都有明显优势。在安全性方面,它是一个硬件级的安全技术,基于对CPU的信任,可以有效避免以往依赖高权限软件而带来的安全隐患;性能方面,在第三代至强可扩展处理器平台上,SGX的计算性能优异,可以有效控制成本;可用性方面,SGX的生态利用LibOS(库操作系统),致力于避免打破现有的应用方式,可以很大程度上降低重新构建一些通信或者是底层架构的代价,从而使数据和模型的加载和保护更加便捷。最大限度上帮助程序开发者把整个数据应用进行无缝迁移,而不像安全多方计算和同态加密或者是差分隐私有一些明显的性能或者是精度上的问题。

通过引入AVX-512的寄存器排列组合,三代英特尔至强可扩展处理器可以实现基于整数的融合乘加操作,之后再通过VPMADD52指令和多缓存并行操作机制,可以在RSA 2048实现相比上一代CPU 5.6倍的提升。此外,在对称加密、伽罗华域、哈希等都有新的指令集,通过指令集架构的实现,以及多缓存并行执行和函数级别的缝合(function stitching)技术,最终实现了大幅度的密码操作硬件加速。

在AI加速方面,以现如今在游戏厂商中广受欢迎的3D人脸建模为例,利用英特尔Ice-Lake上面的VNNI指令集,在int8上实现了从人脸照片到三维模型的图像映射。通过一个FP32向int8的转换,可实现4.23倍的性能提升;在自然语言处理方面,英特尔也通过和阿里云对Transformer的一个模型进行优化,通过VNNI int8实现了3倍的性能提升。

目前市场上的主流开源框架,诸如TensorFlow、PyTorch、MXNet,包括英特尔开源倡导的Analytics Zoo,都是在英特尔的DLBoost指令集上进行的优化,自然也得到了相应的性能提升,正因为如此,第三代至强可扩展处理器可以在深度学习的图像视频应用、或是NLP、推荐系统等应用场景中,具有针对性地使用int8、FP32或者BF16指令集进行加速,并根据软件需要及代码灵活实现。

从这几年英特尔的战略转变不难看出,英特尔早就开启了从CPU到XPU的旅程,通过Xe架构补全了英特尔在GPU上的空白,从而拿下异构计算中最后一块重要拼图。同时随着IDM 2.0的稳步推进,英特尔在设计、制造、封装、测试一体化、IDM方面拥有了更多可选择的余地,可以快速推动产品进程并拓展生态合作。

未来十年将是计算架构的黄金十年。对此,业内众多企业也纷纷针对多计算架构进行了部署,全新的英特尔至强产品路线图,无一不在彰显着自己在软件、芯片和平台方面的深度与广度,在封装和制程工艺方面的技术,以及在大规模制造上的实力,这一切都在说明,英特尔已经为千倍算力增长的数字化时代做好了准备。

(7870991)

继续阅读