天天看点

CPO与Optical IO的区别

作者:光学小豆芽

Ayar Labs最近在其官网发表了一篇技术文章"In-Package Optical I/O versus Co-Packaged Optics – Let’s Get Technical!"(原文链接 https://ayarlabs.com/in-package-optical-i-o-versus-co-packaged-optics-lets-get-technical/),详细阐述了CPO与Optical IO的区别与联系,小豆芽这里整理下相关观点,加入点自己的思考,供大家参考。

Co-packaged optics(以下简称CPO)技术的出发点主要是为了取代传统的可插拔光模块,将光芯片与交换芯片在基板上封装在一起,进一步降低功耗,提高带宽,其主要用于数据中心的以太网网络。从可插拔光模块到CPO的演化图如下图所示,光引擎与switch芯片的距离越来越近。

CPO与Optical IO的区别

(图片来自文献1)

典型的CPO结构如下图所示,PCB中心为交换芯片,16个光引擎围绕在switch的四周。

CPO与Optical IO的区别

(图片来自https://www.gazettabyte.com/home/2022/2/26/the-various-paths-to-co-packaged-optics.html)

下图是Cisco总结的可插拔光模块与CPO模块的功耗对比,基于CPO的交换机系统整体功耗会降低30%左右。

CPO与Optical IO的区别

(图片来自https://blogs.cisco.com/sp/cisco-demonstrates-co-packaged-optics-cpo-system-at-ofc-2023)

Optical IO是为了解决计算芯片CPU, GPU, XPU等之间的互联问题(chip to chip interconnect),利用光互连低功耗、高带宽、低延迟的优势,取代传统的electrical IO方案,芯片输入输出的IO变为光信号,进而构建分布式计算网络。为了实现计算资源的池化技术,Optical IO对延迟latency的要求比较高。从封装形式上看,Optical IO也是将光芯片与电芯片封装在同一基板上。下图是典型的Optical IO结构示意图,

CPO与Optical IO的区别

(图片来自https://community.cadence.com/cadence_blogs_8/b/breakfast-bytes/posts/photonics-keynote)

Intel在其ppt中也比较过可插拔光模块、CPO与Optical IO在性能上的差异,如下图所示,单个CPO模块的带宽为1.6-3.2Tbps, 带宽密度为50-200Gbps/mm, 能效为15pJ/bit, 而Optical IO的总带宽为40Tbps, 带宽密度为5Tbps/mm, 能效为3pJ/bit。

CPO与Optical IO的区别

Ayar Labs定义了FOM1值,用边带宽密度(shortline bandwidth density)除以能效,体现了不同方案对外输出数据的能力。如下图所示,横轴为信号传输距离,纵轴为FOM1值。图片中包括了UCle, NVlink, PCIe等电互联标准。Optical IO的FOM1值与这些电互联标准相当,但传输距离远超它们。CPO的FOM1值比Optical IO小一个数量级。

CPO与Optical IO的区别

Ayar Labs定义了另一个FOM值,用面积带宽密度除以能效,体现了芯片/package的面积使用效率,不同互联标准的比较如下图所示。Optical IO的FOM2值比UCIe小,但仍然比CPO大一个数量级。

CPO与Optical IO的区别

从延迟角度上看,Optical IO的延迟在5ns左右,对应的BER为1e-15, 而CPO为了达到相同的BER, 需要使用FEC(forwar error correction)技术,其延迟在100-150ns。上百秒的延迟对于以太网互联的场景是可以接受的,但是旨在通过芯片池化实现分布式计算系统的场景中是不能接受的。

目前各大芯片巨头都已经在Optical IO领域进行布局,包括Intel、AMD、Nvidia等。Intel已经与Ayar Labs合作多年,多次在OFC上展示了其FPGA芯片间通过Optical IO实现信号互联的阶段性进展。AMD通过收购Xilinx, 整合了其硅光团队,在ISSCC 2023展示了其初步的进展。Nividia一方面与Ayar Labs展开合作,其内部也有自己的硅光团队在开发相关的技术。下图是AMD的最新进展。

CPO与Optical IO的区别

(图片来自文献2)

当然了,Ayar Labs是该领域的执牛首者,其TeraPHY产品已经小批量出货。Ayar Labs在OFC 2023上展示了TeraPHY可以实现双向4.096Tbps的数据传输,误码率为1e-15, 链路如下图所示,链路中含8根光纤,每根光纤中携带8个波长的信号,单个微环调制器的速率为32Gbps。

CPO与Optical IO的区别

(图片来自https://www.hpcwire.com/2023/03/01/ayar-labs-to-demo-commercial-grade-4tbps-optical-i-o-solution/)

相比较而言,CPO技术主要是传统的光模块公司在推进,目前已经有多家公司宣称有对应的产品,包括Cisco、Broadcom、Intel等。但是CPO何时能够真正取代可插拔光模块,还有待于市场的检验与认可。Broadcom和Marvell最近分别在OFC 2023上发布了其51.2Tbps的交换芯片,Broadcom采用8个光引擎,如下图所示,每个光引擎中含64通道,单通道的速率为100Gbps。Marvell的单个光引擎带宽为1.6Tbps, 单通道速率200Gbps。

CPO与Optical IO的区别

(图片来自https://www.servethehome.com/broadcom-tomahawk-5-based-51-2t-bailly-co-packaged-optics-switch-shown-cpo/)

简单总结一下,从封装形态上看,CPO与Opitcal IO都是将光芯片和电芯片在基板上封装在一起,只是CPO针对的是交换芯片,Optical IO针对的是计算芯片。两者分别想取代的技术是可插拔光模块和electrical IO。Optical IO的带宽密度、功耗、延迟等指标优于CPO。Optical IO的技术落地难度相对较大,需要与计算芯片联合设计仿真优化。由于当前AI技术对算力的持续需求,类似ChatGPT这种大规模的机器学习模型,GPU芯片、存储芯片之间有大量的数据传输,Optical IO技术刚好可以发挥其优势,提供低功耗、低延迟和高带宽的数据传输。硅光技术可能是Optical IO的唯一光学解决方案,采用体积小、功耗低的微环调制器,利用多个波长携带信号,提高带宽密度。

文章中如果有任何错误和不严谨之处,还望大家不吝指出,欢迎大家留言讨论。目前三个微信群都已经满员,小豆芽已经新开了微信讨论群4,有需要的朋友可以直接添加我的个人微信photon_walker。

参考文献:

  1. C. Minkenberg, et.al., "Co-packaged datacenter optics: Opportunities and challenges", IET Optoelectronics 15, 77(2021)
  2. M. Raj, et.al., "A 0.96pJ/b 7*50Gbps-per-fiber WDM Receiver with Stacked 7nm CMOS and 45nm Silicon Dies", ISSCC 2023

继续阅读