天天看點

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

作者:天文頌史
利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

«——【·引言·】——»

随着科技的不斷進步,智能晶片已經成為了現代電子産品中不可或缺的一部分。智能晶片的設計與制造需要考慮許多因素,其中一個重要的因素就是晶片内部的資料通信。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

無線網絡在晶片内部資料通信中的應用也越來越廣泛,但如何實作高效的晶片内部資料通信,一直是智能晶片設計中的一個難題。

而自适應波束形成技術則成為了提高晶片内部無線網絡資料傳輸效率的一種重要手段。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

自适應波束形成技術通過調整發射天線的方向,将信号聚焦在接收天線上,進而提高信号傳輸的效率和可靠性。

不過,在晶片内部的資料通信中,流量控制也是一個非常重要的問題。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

如果晶片内部的資料傳輸量過大,将會導緻通信的延遲和擁堵,進而影響晶片的整體性能。如何實作主動的流量控制,也是智能晶片設計中需要解決的一個問題。

針對這一問題,研究人員提出了一種新的解決方案,即利用自适應波束形成技術實作智能晶片内部資料通信的主動流量控制。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

«——【·智能層内資料通信(PF_SDC)系統架構·】——»

建議的架構基于一個8×8多核(64個核心)WiNoC拓撲結構。每個層級有四個簇,每個簇有64個核心(8×8個核心)。

與将每個核心或處理元(PE)連接配接到路由器的網狀拓撲不同,建議的PF SDC系統通過在四個PE(核心和存儲器)之間共享單個有線路由器來建立可擴充的架構。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

網狀拓撲中,16個核心有16個有線路由器。但在建議的架構中,每個16個核心的簇(4×4個核心)有4個有線路由器。

每個簇的中心還安裝了一個無線路由器,使其對四個有線路由器都可以進行無線通路,而每個簇中的智能頭代理(IHA)就是無線路由器。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

為了充分利用無線媒體,IHA采用适當的流量控制方法。如果将包括無線連結的路由方法與沒有WIs的成對源和目的地之間的有線路徑相比,可以使用無線連結來使總路徑長度最小。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

這可能會在WIs中造成熱點,因為多個消息嘗試同時使用WiFi快捷方式,進而使WIs過載并增加延遲。

這個問題可以通過采用分布式路由的主動流量控制方法來解決,目标是盡可能地使用少量的功率和資源,通過低延遲和高吞吐量的無線連結進行層内通信。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

資料包被分成更小的片段,稱為flits。頭部flit是資料包的初始flit,它包含有關資料包傳遞的控制資訊,例如源位址、目的位址、操作類型、資料包類型、角色、優先級和有效載荷大小。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

路徑flit是資料包的第二個flit,它提供路徑資訊以及資料包在源和目的地之間的目前事務中的順序号。

正文flit,也稱為有效載荷,是資料包的第三個flit,包含要傳輸到目的地的實際資料。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

資料包格式由九個字段組成,包括源位址(Sc),即通信的發起者。目标核心位址由字母DC表示,操作(Op)訓示交易類型(讀、寫、條件寫入、廣播等)。

交換的資訊類型(例如資料、指令或信号類型)由type訓示,而源元件的角色(例如使用者、根等)則由角色表示。

流量的優先級由優先級分類。資料包有效載荷或有效載荷中的位元組數由size表示。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

有效載荷表示由源核心建立的實際資料資訊,而路徑表示資料包的注冊路徑。PF.SDC為每個資料流配置設定一個比例權重以适應服務需求,這是通過将頭檔案中的優先級字段設定為0或1來實作的。

正常或低優先級(LP)資料流量編碼為0,而緊急或高優先級(HP)資料流量編碼為1,緊急流量需要優先服務。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

通常将網絡資源的采購優先考慮給緊急或實時流量,以實作快速可靠的傳輸。最廣泛使用的資料包排程算法是權重公平排隊(WFQ)、權重循環排程(WRR)和嚴格優先(SP)。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

建議的模型采用緊密的排程紀律和機率優先(SPP)排隊機制,以應對饑餓問題并使優先級紀律可調整。

SPP通過檢視隊列是否會被服務,并根據流量提供不同的服務水準來區分自己與傳統排程算法。它通過為每個隊列設定參數(高或低優先級)來提供不同的服務水準,進而有效地利用現有的帶寬,并且需要非常少的記憶體和處理能力。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

«——【·模拟結果和讨論·】——»

在MATLAB SIMULINK中建構了一個實驗模型,用于對建議的PF SDC模型進行實驗研究。模拟器中使用了一個單層或晶片的64核系統。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

将PF SDC的性能與其競争對手進行了比較,包括2D Mesh、RFI、inter WISE和SW WiNoC。在MATLAB SIMULINK中建構了一個實驗模型,用于對建議的PF SDC模型進行實驗研究。

模拟器中使用了一個單層或晶片的64核系統,将PF SDC的性能與其競争對手進行了比較,包括2D Mesh、RFI、inter WISE和SW WiNoC。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

在均勻和非均勻随機流量,以及由流量生成器産生的正常和緊急流量模式的存在下,評估了PF SDC模型的有效性。

關于網絡大小和流量類型,它表示如何将資料注入流配置設定到各個節點以及資料包從源到目的地的傳輸距離(流量跳數)。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

本地流量被定義為通過與注入資料相同的層的流量,資料包最初被保留在源節點的隊列中,等待被注入到網絡中。通過在随機位置停用特定百分比的無線連結來向系統注入故障。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

每個資料包中有64個flit,所有有線連結的寬度都與flit大小(32)相同。輸入仲裁、路由或交換機周遊以及輸出仲裁是NoC交換機設計的三個功能步驟。

每個輸入和輸出端口上的四個虛拟通道都具有兩個flit的緩沖深度。在無線網絡中,使用利用模糊推理引擎的流量控制的路由與有線連結中的方式相同。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

NoC交換機以2.5 GHz的頻率驅動時鐘。模拟器忠實地模拟flit每個周期通過交換機和連結的旅程,考慮到到達目的地和停滞的flit。每個實驗涉及十萬次疊代,以獲得一緻的結果。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

使用逐周期準确的模拟器來評估每個時鐘周期資料flit的進展情況,考慮到到達目的地和丢棄的flit。

實驗過程檢查性能名額,如吞吐量、延遲、可達帶寬、功耗和面積開銷。

«——【·資料吞吐量·】——»

每個嵌入式核心每個時鐘周期成功接收的flit平均數量被稱為吞吐量,它表示在給定的時間内成功從一個節點傳輸到另一個節點的資料量,使用資料包注入率來評估吞吐量(PIR)。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

IP核輸入到網絡中的資料包數量稱為PIR,它的值在0到1之間。例如,PIR = 0.1表示每個節點将每10個時鐘周期發送1個資料包。

假定一定數量的核心頻繁互相通信以産生均勻流量的情況下,大約一半的流量預計來自核心并被定向到另一個核心。在這種設定下,PF_SDC的吞吐量大約比2DMesh高40-45%,比其競争對手高10%以上。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

無線單跳快速連結的優勢在于它減少了延遲,使得遠距離資料傳輸能夠利用PF_SDC中的無線連結,進而顯著提高了吞吐量。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

使用無線連結連接配接WR的IHA,實作通過單跳低延遲通信最有效地確定資料傳輸,同時防止每個核心走過大的實體距離。

通過允許許多核心更頻繁地将其20%的流量發送到單個核心,可以實作非均勻随機流量模式。在這種情況下,所有模型的性能下降速度比均勻流量高。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

這是因為采用了最适路徑路由方法,其中資料包沿從源到目的地選擇的路徑路由,可能會導緻特定連結上的負載增加,在某些情況下會導緻擁塞。

但需要注意的是,即使在這些情況下PF_SDC模型的性能損失也比其競争對手少。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

«——【·可實作帶寬·】——»

根據觀察,PF_SDC和SW WiNoC的可行帶寬高于它們的等效物,這表明具有無線連接配接的系統獲得比有線連接配接更好的帶寬。

在PF SDC範例中,無線節點通過單跳連接配接直接連接配接晶片内部的交換機進行層内資料傳輸。換句話說,與其純粹基于有線連接配接的晶片内部NoCs等效物相比,單晶片PF SDC模型具有更好的帶寬。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

這是因為在所有基于網絡I/O的多核系統(如2DMesh和RFI)中,資料包從内部核心流向外圍I/O,然後路由到層内連接配接并從中心核心到目标層旅行。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

與此相比,PF_SDC每個核心的帶寬超過了約6Gbps的2DMesh和超過5Gbps的SW_WiNoC。

這表明基于網絡I/O的有線拓撲具有最低的性能,因為它們具有許多帶有I/O子產品的交換機,允許相鄰核心之間的并發通信。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

另一方面,當将核心設定為叢集并在PF_SDC中實作直接IHA到IHA的無線連接配接時,帶寬大大增加。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

«——【·延遲·】——»

Flit延遲指從源節點注入頭部flit到目的節點,确認尾部flit所花費的總時間。PF_SDC和其他模型,在均勻和非均勻随機流量存在下,觀察到延遲。

像2DMesh、RFI、inter_WISE、SW_WiNoC和建議的PF_SDC模型在Flit注入速率(FIR)小于0.2 flit/core/cycle時表現出可接受的低延遲。随着注入負載的增加,延遲也會增加。

由于更多的flit被困在路由器緩沖區中,所有三個模型,如2DMesh、RFI和inter_WISE的延遲都會随着FIR的增加而增加。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

與其他方案相比,2DMesh和RFI方案的總延遲是相當大的,因為這些方案中的flit需要經過許多中繼節點,由于它們的非叢集網絡結構。

建議的技術具有低延遲曲線,因為它通過波束形成沿着最佳路徑向目的地方向注入資料包。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

通過積極的流量控制和最适路徑選擇,叢集化的特性有助于通過将flit從源到目的地所經過的中繼節點數量最小化來減少延遲。

當超過FIR門檻值限制時,發現所有方案的延遲曲線都會急劇增加。這是由于等待保留通道被釋放所需的長時間。當注入負載增加時,PF_SDC方案顯示出規律性的延遲上升。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

«——【·功率耗散和區域懸挑·】——»

使用Simulink工具以納秒為機關測量功耗。電氣互連使用半全局金屬線。在32納米技術下,128位金屬連接配接的功耗估計為1 GHz時的23.04 mW/mm。

無線連接配接的功耗采用分析方法計算:在一個10×10的WNoC平台中,每個核心占據1平方毫米的空間。這樣的系統中最長的對角傳輸路徑約為7.5毫米。

具有發射功率為-10dBM的晶片内無線天線的傳輸性能和能量消耗為4.5pJ/bit,使用cycle_accurate模拟器計算每個資料包的有線和無線鍊路周遊次數、緩沖區寫入次數和交叉開關周遊次數。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

每個周遊次數乘以相應的128位功耗,結果顯示,與其SW WiNoc和inter WISE對應物相比,PF_SDC的功耗更低。

這是因為PF_SDC模型中的flit利用IHA行進的跳數較少,通路的FIFO也較少,與其他模型相比,總功耗更低。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

與所有其他無線網絡相比,PF SDC平均節省了約20-30%的功耗,與所有其他電氣網絡相比,平均節省了約40-50%的功耗。

這裡建議的模型考慮了低功耗無線通信和最小跳數網絡,進而在PF_SDC設計中實作了顯著的功耗節省。資料通過合适放置的無線連結路線傳輸到目的地的功耗,比通過電纜傳輸的功耗要少。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

由于通過波束形成決策導向周遊流量模式,PF_SDC的功耗比所有其他無線和電氣網絡都低。當在PF_SDC中使用IHA時,資料的傳輸距離小于晶片的一半。

超過80%的流量使用無線網絡,總體上實作了約55-60%的功耗節省。當超過約90%的無線連結路線用于資料包周遊時,與2DMesh相比,功耗節省率增加到超過70%。

另一方面,非均勻随機流量的功耗略高于均勻流量,因為資料包在不同時間周遊。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

為了衡量性能優勢,将PF_SDC和其他現有體系結構的面積開銷與有線2DMesh進行比較。将具有64個核心的單晶片PF_SDC模型,與其前身以及具有64個核心的平面有線2DMesh系統進行比較。

與PF_SDC設定不同,2DMesh包括許多有線晶片内連結。在PF_SDC架構中,由于發射機和天線限制的晶片内連結數量導緻較低的矽面積開銷。天線的尺寸非常小,是以它們占用的空間非常小。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

調查表明,SW_WiNoC具有更高的開銷,因為每個WiNoC子網中的中心需要占用大量空間,因為它們具有到子網中所有核心的大量端口。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

通過考慮每個收發器占用的面積,計算各種拓撲的總面積開銷。假設每個晶片為20 mm × 20 mm,最大配置的無線多晶片系統的連接配接網絡的總大小為整個系統的1.92%,但無線開銷僅為0.46%。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

由于每個晶片的無線互連數量保持不變,是以對于使用無線連結的其他系統大小,各種面積開銷的比例保持不變。

由于該設計每個路由器分組四個核心,是以PF_SDC的有線端口面積低于SW_WiNoC和inter_WISE。在PF SDC架構中,這種結構降低了總空間開銷。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

«——【·結論·】——»

模拟結果表明,與現有方法如2DMesh、RFI、inter_WISE和SW_WiNoC相比,所提出的PF_SDC技術在快速吞吐量、低延遲、最小面積開銷和低功耗方面表現優異。

在未來的技術基礎上,先進的計算平台可以無縫連接配接,進而從物聯網(IoT)系統中受益。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

多核多晶片無線連接配接架構可以被視為繁榮未來技術的基礎。低功耗、高速的無線互聯還可以使工業4.0和神經形态計算等行業受益。

利用自适應波束形成技術,實作智能晶片内部資料通信的主動流量控制是一種有效的解決方案。随着無線網絡技術的不斷發展和智能晶片的廣泛應用,這種技術将會在未來得到更加廣泛的應用。

利用自适應波束形成技術,實作智能晶片資料通信的主動流量控制

參考文獻:

1.Benini L, De Micheli G. Networks on chips: a new SoC paradigm. Computer (Long Beach Calif). Jan.

2.Wang C, Hu W-H, Lee SE, et al. Area and power-efficient innovative network-on-chip architecurte.

3.Abadal S, Nemirovsky M, Alarcón E, et al. Networking challenges and prospective impact of broadcast-oriented wireless networks-on-chip.

4.Chang MF, et al. CMP network-on-chip overlaid with multi-band RF-interconnect.

5.Shacham A, Bergman K, Carloni LP. Photonic networks-on-chip for future generations of chip multiprocessors.

繼續閱讀