天天看点

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

作者:天文颂史
利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

«——【·引言·】——»

随着科技的不断进步,智能芯片已经成为了现代电子产品中不可或缺的一部分。智能芯片的设计与制造需要考虑许多因素,其中一个重要的因素就是芯片内部的数据通信。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

无线网络在芯片内部数据通信中的应用也越来越广泛,但如何实现高效的芯片内部数据通信,一直是智能芯片设计中的一个难题。

而自适应波束形成技术则成为了提高芯片内部无线网络数据传输效率的一种重要手段。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

自适应波束形成技术通过调整发射天线的方向,将信号聚焦在接收天线上,从而提高信号传输的效率和可靠性。

不过,在芯片内部的数据通信中,流量控制也是一个非常重要的问题。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

如果芯片内部的数据传输量过大,将会导致通信的延迟和拥堵,从而影响芯片的整体性能。如何实现主动的流量控制,也是智能芯片设计中需要解决的一个问题。

针对这一问题,研究人员提出了一种新的解决方案,即利用自适应波束形成技术实现智能芯片内部数据通信的主动流量控制。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

«——【·智能层内数据通信(PF_SDC)系统框架·】——»

建议的架构基于一个8×8多核(64个核心)WiNoC拓扑结构。每个层级有四个簇,每个簇有64个核心(8×8个核心)。

与将每个核心或处理元(PE)连接到路由器的网状拓扑不同,建议的PF SDC系统通过在四个PE(核心和存储器)之间共享单个有线路由器来创建可扩展的架构。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

网状拓扑中,16个核心有16个有线路由器。但在建议的架构中,每个16个核心的簇(4×4个核心)有4个有线路由器。

每个簇的中心还安装了一个无线路由器,使其对四个有线路由器都可以进行无线访问,而每个簇中的智能头代理(IHA)就是无线路由器。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

为了充分利用无线介质,IHA采用适当的流量控制方法。如果将包括无线链接的路由方法与没有WIs的成对源和目的地之间的有线路径相比,可以使用无线链接来使总路径长度最小。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

这可能会在WIs中造成热点,因为多个消息尝试同时使用WiFi快捷方式,从而使WIs过载并增加延迟。

这个问题可以通过采用分布式路由的主动流量控制方法来解决,目标是尽可能地使用少量的功率和资源,通过低延迟和高吞吐量的无线链接进行层内通信。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

数据包被分成更小的片段,称为flits。头部flit是数据包的初始flit,它包含有关数据包传递的控制信息,例如源地址、目的地址、操作类型、数据包类型、角色、优先级和有效载荷大小。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

路径flit是数据包的第二个flit,它提供路径信息以及数据包在源和目的地之间的当前事务中的顺序号。

正文flit,也称为有效载荷,是数据包的第三个flit,包含要传输到目的地的实际数据。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

数据包格式由九个字段组成,包括源地址(Sc),即通信的发起者。目标核心地址由字母DC表示,操作(Op)指示交易类型(读、写、条件写入、广播等)。

交换的信息类型(例如数据、指令或信号类型)由type指示,而源组件的角色(例如用户、根等)则由角色表示。

流量的优先级由优先级分类。数据包有效载荷或有效载荷中的字节数由size表示。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

有效载荷表示由源核心创建的实际数据信息,而路径表示数据包的注册路径。PF.SDC为每个数据流分配一个比例权重以适应服务需求,这是通过将头文件中的优先级字段设置为0或1来实现的。

正常或低优先级(LP)数据流量编码为0,而紧急或高优先级(HP)数据流量编码为1,紧急流量需要优先服务。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

通常将网络资源的采购优先考虑给紧急或实时流量,以实现快速可靠的传输。最广泛使用的数据包调度算法是加权公平排队(WFQ)、加权循环调度(WRR)和严格优先(SP)。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

建议的模型采用紧密的调度纪律和概率优先(SPP)排队机制,以应对饥饿问题并使优先级纪律可调整。

SPP通过查看队列是否会被服务,并根据流量提供不同的服务水平来区分自己与传统调度算法。它通过为每个队列设置参数(高或低优先级)来提供不同的服务水平,从而有效地利用现有的带宽,并且需要非常少的内存和处理能力。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

«——【·模拟结果和讨论·】——»

在MATLAB SIMULINK中构建了一个实验模型,用于对建议的PF SDC模型进行实验研究。模拟器中使用了一个单层或芯片的64核系统。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

将PF SDC的性能与其竞争对手进行了比较,包括2D Mesh、RFI、inter WISE和SW WiNoC。在MATLAB SIMULINK中构建了一个实验模型,用于对建议的PF SDC模型进行实验研究。

模拟器中使用了一个单层或芯片的64核系统,将PF SDC的性能与其竞争对手进行了比较,包括2D Mesh、RFI、inter WISE和SW WiNoC。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

在均匀和非均匀随机流量,以及由流量生成器产生的常规和紧急流量模式的存在下,评估了PF SDC模型的有效性。

关于网络大小和流量类型,它表示如何将数据注入流分配到各个节点以及数据包从源到目的地的传输距离(流量跳数)。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

本地流量被定义为通过与注入数据相同的层的流量,数据包最初被保留在源节点的队列中,等待被注入到网络中。通过在随机位置停用特定百分比的无线链接来向系统注入故障。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

每个数据包中有64个flit,所有有线链接的宽度都与flit大小(32)相同。输入仲裁、路由或交换机遍历以及输出仲裁是NoC交换机设计的三个功能步骤。

每个输入和输出端口上的四个虚拟通道都具有两个flit的缓冲深度。在无线网络中,使用利用模糊推理引擎的流量控制的路由与有线链接中的方式相同。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

NoC交换机以2.5 GHz的频率驱动时钟。模拟器忠实地模拟flit每个周期通过交换机和链接的旅程,考虑到到达目的地和停滞的flit。每个实验涉及十万次迭代,以获得一致的结果。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

使用逐周期准确的模拟器来评估每个时钟周期数据flit的进展情况,考虑到到达目的地和丢弃的flit。

实验过程检查性能指标,如吞吐量、延迟、可达带宽、功耗和面积开销。

«——【·数据吞吐量·】——»

每个嵌入式核心每个时钟周期成功接收的flit平均数量被称为吞吐量,它表示在给定的时间内成功从一个节点传输到另一个节点的数据量,使用数据包注入率来评估吞吐量(PIR)。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

IP核输入到网络中的数据包数量称为PIR,它的值在0到1之间。例如,PIR = 0.1表示每个节点将每10个时钟周期发送1个数据包。

假定一定数量的核心频繁相互通信以产生均匀流量的情况下,大约一半的流量预计来自核心并被定向到另一个核心。在这种设置下,PF_SDC的吞吐量大约比2DMesh高40-45%,比其竞争对手高10%以上。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

无线单跳快速链接的优势在于它减少了延迟,使得远距离数据传输能够利用PF_SDC中的无线链接,从而显著提高了吞吐量。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

使用无线链接连接WR的IHA,实现通过单跳低延迟通信最有效地确保数据传输,同时防止每个核心走过大的物理距离。

通过允许许多核心更频繁地将其20%的流量发送到单个核心,可以实现非均匀随机流量模式。在这种情况下,所有模型的性能下降速度比均匀流量高。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

这是因为采用了最适路径路由方法,其中数据包沿从源到目的地选择的路径路由,可能会导致特定链接上的负载增加,在某些情况下会导致拥塞。

但需要注意的是,即使在这些情况下PF_SDC模型的性能损失也比其竞争对手少。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

«——【·可实现带宽·】——»

根据观察,PF_SDC和SW WiNoC的可行带宽高于它们的等效物,这表明具有无线连接的系统获得比有线连接更好的带宽。

在PF SDC范例中,无线节点通过单跳连接直接连接芯片内部的交换机进行层内数据传输。换句话说,与其纯粹基于有线连接的芯片内部NoCs等效物相比,单芯片PF SDC模型具有更好的带宽。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

这是因为在所有基于网络I/O的多核系统(如2DMesh和RFI)中,数据包从内部核心流向外围I/O,然后路由到层内连接并从中心核心到目标层旅行。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

与此相比,PF_SDC每个核心的带宽超过了约6Gbps的2DMesh和超过5Gbps的SW_WiNoC。

这表明基于网络I/O的有线拓扑具有最低的性能,因为它们具有许多带有I/O模块的交换机,允许相邻核心之间的并发通信。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

另一方面,当将核心设置为集群并在PF_SDC中实现直接IHA到IHA的无线连接时,带宽大大增加。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

«——【·延迟·】——»

Flit延迟指从源节点注入头部flit到目的节点,确认尾部flit所花费的总时间。PF_SDC和其他模型,在均匀和非均匀随机流量存在下,观察到延迟。

像2DMesh、RFI、inter_WISE、SW_WiNoC和建议的PF_SDC模型在Flit注入速率(FIR)小于0.2 flit/core/cycle时表现出可接受的低延迟。随着注入负载的增加,延迟也会增加。

由于更多的flit被困在路由器缓冲区中,所有三个模型,如2DMesh、RFI和inter_WISE的延迟都会随着FIR的增加而增加。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

与其他方案相比,2DMesh和RFI方案的总延迟是相当大的,因为这些方案中的flit需要经过许多中继节点,由于它们的非集群网络结构。

建议的技术具有低延迟曲线,因为它通过波束形成沿着最佳路径向目的地方向注入数据包。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

通过积极的流量控制和最适路径选择,集群化的特性有助于通过将flit从源到目的地所经过的中继节点数量最小化来减少延迟。

当超过FIR阈值限制时,发现所有方案的延迟曲线都会急剧增加。这是由于等待保留通道被释放所需的长时间。当注入负载增加时,PF_SDC方案显示出规律性的延迟上升。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

«——【·功率耗散和区域悬挑·】——»

使用Simulink工具以纳秒为单位测量功耗。电气互连使用半全局金属线。在32纳米技术下,128位金属连接的功耗估计为1 GHz时的23.04 mW/mm。

无线连接的功耗采用分析方法计算:在一个10×10的WNoC平台中,每个核心占据1平方毫米的空间。这样的系统中最长的对角传输路径约为7.5毫米。

具有发射功率为-10dBM的芯片内无线天线的传输性能和能量消耗为4.5pJ/bit,使用cycle_accurate模拟器计算每个数据包的有线和无线链路遍历次数、缓冲区写入次数和交叉开关遍历次数。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

每个遍历次数乘以相应的128位功耗,结果显示,与其SW WiNoc和inter WISE对应物相比,PF_SDC的功耗更低。

这是因为PF_SDC模型中的flit利用IHA行进的跳数较少,访问的FIFO也较少,与其他模型相比,总功耗更低。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

与所有其他无线网络相比,PF SDC平均节省了约20-30%的功耗,与所有其他电气网络相比,平均节省了约40-50%的功耗。

这里建议的模型考虑了低功耗无线通信和最小跳数网络,从而在PF_SDC设计中实现了显著的功耗节省。数据通过合适放置的无线链接路线传输到目的地的功耗,比通过电缆传输的功耗要少。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

由于通过波束形成决策导向遍历流量模式,PF_SDC的功耗比所有其他无线和电气网络都低。当在PF_SDC中使用IHA时,数据的传输距离小于芯片的一半。

超过80%的流量使用无线网络,总体上实现了约55-60%的功耗节省。当超过约90%的无线链接路线用于数据包遍历时,与2DMesh相比,功耗节省率增加到超过70%。

另一方面,非均匀随机流量的功耗略高于均匀流量,因为数据包在不同时间遍历。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

为了衡量性能优势,将PF_SDC和其他现有体系结构的面积开销与有线2DMesh进行比较。将具有64个核心的单芯片PF_SDC模型,与其前身以及具有64个核心的平面有线2DMesh系统进行比较。

与PF_SDC设置不同,2DMesh包括许多有线芯片内链接。在PF_SDC架构中,由于发射机和天线限制的芯片内链接数量导致较低的硅面积开销。天线的尺寸非常小,因此它们占用的空间非常小。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

调查表明,SW_WiNoC具有更高的开销,因为每个WiNoC子网中的中心需要占用大量空间,因为它们具有到子网中所有核心的大量端口。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

通过考虑每个收发器占用的面积,计算各种拓扑的总面积开销。假设每个芯片为20 mm × 20 mm,最大配置的无线多芯片系统的连接网络的总大小为整个系统的1.92%,但无线开销仅为0.46%。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

由于每个芯片的无线互连数量保持不变,因此对于使用无线链接的其他系统大小,各种面积开销的比例保持不变。

由于该设计每个路由器分组四个核心,因此PF_SDC的有线端口面积低于SW_WiNoC和inter_WISE。在PF SDC架构中,这种结构降低了总空间开销。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

«——【·结论·】——»

模拟结果表明,与现有方法如2DMesh、RFI、inter_WISE和SW_WiNoC相比,所提出的PF_SDC技术在快速吞吐量、低延迟、最小面积开销和低功耗方面表现优异。

在未来的技术基础上,先进的计算平台可以无缝连接,从而从物联网(IoT)系统中受益。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

多核多芯片无线连接架构可以被视为繁荣未来技术的基础。低功耗、高速的无线互联还可以使工业4.0和神经形态计算等行业受益。

利用自适应波束形成技术,实现智能芯片内部数据通信的主动流量控制是一种有效的解决方案。随着无线网络技术的不断发展和智能芯片的广泛应用,这种技术将会在未来得到更加广泛的应用。

利用自适应波束形成技术,实现智能芯片数据通信的主动流量控制

参考文献:

1.Benini L, De Micheli G. Networks on chips: a new SoC paradigm. Computer (Long Beach Calif). Jan.

2.Wang C, Hu W-H, Lee SE, et al. Area and power-efficient innovative network-on-chip architecurte.

3.Abadal S, Nemirovsky M, Alarcón E, et al. Networking challenges and prospective impact of broadcast-oriented wireless networks-on-chip.

4.Chang MF, et al. CMP network-on-chip overlaid with multi-band RF-interconnect.

5.Shacham A, Bergman K, Carloni LP. Photonic networks-on-chip for future generations of chip multiprocessors.

继续阅读