天天看點

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

從超極本到Evo,從USB 1.0到雷電4,多年以來英特爾一直在平台創新方面有着異樣的執着。但可惜的是,在獨立顯示卡領域,雖然之前做過多番努力,但收效一直甚微。現在,英特爾正式釋出了基于移動平台的銳炫獨顯系列,它是否能成為英特爾下一個重要的裡程碑,并借此補上英特爾平台的短闆,使其真正達到“完美”?

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

2022年3月30日,英特爾正式釋出了基于移動平台的銳炫A系列移動端獨顯。毫無疑問,筆記本電腦中的英特爾銳炫系列标志着英特爾旅程中的下一個重要節點。首批英特爾銳炫 3 系列筆記本電腦現已上市,随後是今年夏天功能更強大的英特爾銳炫 5 系列和 7 系列的産品。銳炫移動獨顯都将包含通用架構和進階功能集,包括支援DX12 Ultimate終極版以及英特爾先進的AI和媒體引擎。其中銳炫3系列可以為Evo輕薄筆記本電腦提供增強的1080p遊戲和内容創作性能。銳炫5系列和銳炫7系列将提供同樣領先的内容創作功能,但具有更高的圖形和計算能力。

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析
Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

Xe-HPG,為遊戲和創作奠基

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

英特爾銳炫A系列産品都基于英特爾研發的Xe HPG獨顯架構,它包含了性能強勁的AI引擎和支援下一代編解碼器标準的增強媒體引擎。除此以外,英特爾還打造了下一代Xe顯示引擎和新的圖形管線,用來處理各種不同的顯示任務。

Xe-HPG:渲染切片(Rendering Slice)

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

要了解Xe-HPG架構,首先來看看“Rendering Slice(渲染切片)”。這是Xe-HPG架構中的一種可重用IP的基本建構塊。在Xe-HPG微架構裡,每4個Xe核心組成一個渲染切片。每一個Xe核心中都配備了數量可觀的運算單元,比如矢量引擎 XVE、矩陣引擎XMX等。此外Xe-HPG也內建了其他主流的圖形技術,比如網格着色,采樣器回報等。

Xe-HPG最大的特點就是靈活性,通過疊加渲染切片可以建構不同的SOC(最小兩個,最大八個),這樣就增強了Xe-HPG的可擴充性并使得産品線更加豐富。與上一代Xe-LP微架構相比,Xe-HPG的每瓦性能提升了1.5倍。同時,Xe-HPG的渲染切片支援DX12 Ultimate、微軟DXR 和 Vulkan RT 的專用硬體光追單元。每個切片還配備了四個硬體光追加速器,用來支援實時光線追蹤。也就是說,Xe-HPG架構是硬體支援光追的,遊戲玩家們可以多一些選擇了。

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析
Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

Xe-HPG:Xe-Core

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

再來看下Xe-HPG的核心架構與組成子產品。作為Xe-HPG架構的核心組成單元,Xe-Core(Xe核心)取代了EU的概念,成為Xe-HPG架構中最基礎的執行單元。每個Xe核心包括16個256位寬的SIMD矢量引擎,為傳統圖形着色器執行大部分運算,主要負責傳統圖像處理的計算。由于AI的算法核心幾乎完全圍繞着一系列大型的矩陣乘法和累加算法,是以英特爾在每個 Xe 核心中建構了專用的矩陣引擎,來進行硬體加速。Xe核心包含16個矩陣引擎,每個引擎都是1024 位寬。矩陣引擎就是為了加速AI運算用的。為了滿足矩陣、矢量和光線追蹤單元的高帶寬需求,我們在每個Xe核心中建構了一個192KB 的大型本地記憶體。它可以根據每個工作負載的需要在L1緩存和共享本地記憶體(SLM) 之間動态配置設定。

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

Xe核心的矢量引擎改進了ALU單元,FP指令可以與整數運算(INT)指令同時運作,其中包括 DP4a的快速INT8計算。此外英特爾還強化了AI能力,增加了新的 XMX 矩陣引擎,用于高吞吐量矩陣乘法,涵蓋最常見的AI資料類型,包括BF16和INT8。為了有效提高執行性能和算力,Xe-HPG可以同時排程和執行浮點FP、整數INT和XMX指令,并以鎖步形式并行兩個引擎和共享資源。

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析
Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

下面是英特爾給出的一個範例。Xe-HPG的矢量引擎使用基本SIMD矢量指令,執行8次并行運算乘法,然後執行8次并行加法(即每個時鐘共16個Ops)。

DP4a是針對那些不需要32 位精度的AI計算所做的優化。它将所有32位輸入分成8位塊,然後獨立地乘以這些塊。這總共是32次并行乘法(由紫色方塊顯示),然後32次累加達到每個周期總共64次操作,比标準SIMD MAC提高了4倍的性能。

最後,矩陣引擎XMX通過将乘法累加4深度流水線化,将其提升到一個新的水準。與DP4a 一樣,每個操作數都被分成4個塊,這些塊被獨立的相乘和累加實作每個階段64個操作指令(紫色圖塊顯示)。通過4深度流水線,每個時鐘産生256次操作,達到了傳統的32位SIMD MAC 16倍的性能。

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

XeSS:對标DLSS與FSR

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

XMX矩陣引擎的一個主要應用是在實時渲染過程中使用AI,這也直接導緻了XeSS的誕生。XeSS是一種超級采樣技術,與傳統的高分辨率渲染相比,可在遊戲中提供更高的性能。它使用神經網絡輔助運動矢量,從低分辨率渲染中生成精美的高分辨率圖像。看到這裡想必大家都覺得不陌生了。對!NVIDIA DLSS和AMD FSR異口同聲喊出了“這我熟!”不過在會上,英特爾尚未公布XeSS發更多的技術細節與實際性能表現,有待後續測試驗證。

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

▲英特爾公布了有14款遊戲将支援XeSS技術,預計未來幾個月還會有更多的遊戲加入。

Xe媒體引擎:優化編解碼加速媒體創作播放

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

在英特爾看來,Xe核心中的Xe媒體引擎算得上是最先進的媒體加速器之一。Xe媒體引擎内置了業内常用的編/解碼器,包括H.265 / HEVC、H.264 / MPEG-4 / AVC、VP9 以及對AV1編碼和解碼的硬體加速支援,尤其是在對AV1建構硬體編碼支援上,英特爾走在了前列。

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

AV1的效率比最常見的編解碼器H.264高了50%,比HEVC高了20%,使視訊創作者能夠以更低的帶寬和更小的檔案大小提供更高的畫面品質。和以前的編/解碼器相比,AV1提供了更好的壓縮比和更好的視覺效果。銳炫顯示卡中的AV1編碼硬體加速與傳統的軟體實作相比,編碼速度提高了50倍。目前,FFMPEG、Handbrake、Adobe 和 XSplit 都已經內建了對銳炫 AV1的支援。

Xe顯示引擎:高輸出規格,SpeedSync解決畫面撕裂

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

在顯示輸出部分,Xe-HPG支援HDMI 2.0b和DP1.4a規格,也就意味着遊戲玩家将能夠享受1080p@360Hz、或者4台具有4k@120Hz HDR的顯示器聯合輸出。這一點與目前NVIDIA和AMD主流顯示卡保持一緻。

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

另外值得一提的是Xe顯示引擎中的Speed Sync。從名字上就可以看出,這是一種類似AMD FreeSync或NVIDIA G-Sync的技術,可以解決由于顯示卡輸出與顯示器重新整理率不同步導緻的畫面撕裂問題。

除了 SpeedSync之外,Smooth Sync也伴随銳炫一起推出的另一項全新英特爾技術。它可以通過抖動過濾功能對畫面撕裂進行模糊化處理,以此解決畫面撕裂問題,為玩家提供更好的遊戲沉浸感,也就是利用模糊化處理來減少畫面失真并使圖像看起來更加連貫。目前英特爾表示所有銳炫顯示卡都會支援Smooth Sync功能。

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

Alchemist産品預覽

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

英特爾這一代銳炫A系列顯示卡代号為Alchemist,共有兩種不同的晶片設計。其中如上圖左所示,面積比較大的晶片代号ACM-G10,包含32個Xe核心和光追單元,16MBL2緩存,256位GDDR6接口,16路PCIE4接口;右邊較小的晶片代号ACM-G11,包含8個Xe核心和光追單元,4MBL2緩存,96位顯存接口,8路PCIE4. 兩種晶片設計都包含兩個Xe多功能編解碼引擎和4路顯示輸出引擎。

具體到産品上,英特爾銳炫A系列移動端獨立顯示卡覆寫了從适用于輕薄筆記本的低功耗主流顯示卡,到适用于遊戲本的高性能顯示卡。

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析
Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

從圖中可以看出,英特爾此次公布的銳炫移動顯示卡主要包括銳炫3系列的A350M和A370M,銳炫5系列的A550M以及銳炫7系列的A730M和A770M。

很明顯,銳炫3系列的兩款産品是基于8個Xe核心設計的晶片,配置了4GB GDDR6顯存,TDP最高50W,最低25W。A550M的Xe核心數和顯存位寬等等,基本是A370M的兩倍,應該是基于32Xe核心的晶片精簡規格所得。最後來看銳炫7系列,同樣有A730M和A770M兩款産品,最高可達32Xe核心,16GB記憶體,256bit位寬。這裡提醒一下産品上市時間,搭載銳炫3系列A350M和A370M的産品馬上就會與最終使用者見面,而搭載銳炫5和銳炫7系列的産品,會在今年夏天面市。同時,全系列的銳炫A系列移動獨顯都支援DirectX12 Ultimate終極版,包括光線追蹤、可變速率着色、網格着色和采樣器回報等。

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

▲從英特爾公布的資料來看,在1080p分辨率,中或者高畫質設定下,A370M相對于12代酷睿移動處理器的核顯有最多可達兩倍的性能提升。同時這些遊戲都能在1080p@60fps運作,能給使用者不錯的體驗。

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

▲A370M顯示卡能在1080p分辨率下在多數競技遊戲中達到90fps,而且這是在開了中等或者高畫質下測量的結果。

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

▲和12代酷睿的內建顯示卡相比,在搭載A370M獨立顯示卡的平台上,設計創作性能也有了顯著提升。在視訊編解碼方面,以Davinci為例,4K H.264轉H.265的性能可多達60%的提升。而在AI相關功能上,例如Adobe PR裡的兩個應用場景,更是有翻倍的性能提升。

Deep Link:性能提升的秘訣

在上面我們看到了銳炫A系列顯示卡的創作有了巨大性能提升,但這并不僅僅來自于獨立顯示卡,同樣得益于基于整個系統的Deep Link技術的加持。

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

什麼是Deep Link?它實際上是一個總稱,涵蓋了不同的技術,如動态功率共享、超級編碼和超級算力等。

先來看動态功率共享,這項技術能在系統功耗的限制範圍内,盡可能最大化釋放CPU或GPU的性能。早在2016年,英特爾就推出了第一版動态功率共享,在CPU和GPU之間動态配置設定功率。總的來說,在運作負載時,如果CPU更需要功率,系統會把功率更多地配置設定給CPU,反之對GPU也是一樣,最終目的是在筆記本整體功率一定的情況下讓其在應用中表現出更好的性能。

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析
Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

如圖所示,當系統發現GPU負載過高,系統會動态調整GPU和CPU的功率配比,将更多的功率配置設定給GPU。當系統發現GPU負載較低,比如輕辦公場景,則會動态調整功率配比,将功率配置設定向CPU。如果達到了良好的動态平衡,就維持目前的功率配比。所有搭載英特爾12代酷睿和銳炫的筆記本電腦,都能啟用這項技術。

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

再來看超級編碼技術,就是同時運用兩個顯示卡的編解碼引擎,來大大提升編解碼效率。這種協作是通過OneVPL的API接口來實作的。OneVPL是一個跨平台的開放性架構,應用程式通過接口可以識别并調用平台上多個多媒體引擎,充分利用視訊處理能力。當超級編碼開始工作時,一組組解碼後的原始幀通過特定的API函數被交給oneVPL,進而按組被配置設定到不同的多媒體引擎上,拷貝到相應的記憶體中緩存起來。不論每一組有多少幀,相應的集顯或者獨顯的多媒體引擎會開始按照設定的格式編碼。而OneVPL會完成後續的打包工作,把編碼後的幀一組組拼接成最終視訊來輸出。這種并行處理,編碼效率比單一顯示卡提升非常顯著。

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析
Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

最後說說超級算力。每一款搭載英特爾銳炫獨立顯示卡的筆記本,都可以從獨立顯示卡的算力中獲益,但是英特爾CPU的內建顯示卡中同樣也提供了計算引擎。是以英特爾就想把負載合理的配置設定給不同的計算引擎,是以設計了MLS,這是一個基于機器學習的服務。

MLS是OpenVino中的一個架構,它能智能地把負載配置設定給不同的算力子產品。根據目前應用或負載的特征,例如延遲敏感度、吞吐量、性能要求、功率消耗等等。這些因素幫助MLS做出決策,把負載配置設定給獨立顯示卡、內建顯示卡或者CPU。當你想對一段視訊做處理,例如去噪點、超分、銳化等,導入畫面會逐幀傳遞給MLS架構,每一幀還會拆成若幹塊,這些塊排在工作隊列裡。MLS啟動一個個工作線程,把這些塊根據需求自動配置設定到不同的算力子產品中。如上圖所示,一部分配置設定到集顯的計算引擎,一部分配置設定到獨顯的矩陣引擎。随着顯示卡完成目前任務,MLS會不斷派發新的任務。直到最後完成所有塊的處理,打包這些增強後的畫面作為輸出。

Arc Control:驅動面闆功能豐富

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

伴随銳炫移動獨顯産品的推出,英特爾也釋出了一個新的顯示卡驅動控制界面,叫Arc Control——英特爾銳炫控制台。Arc Control提供了一站式與銳炫顯示卡相關的設定或者資訊接收,包括可以讓使用者快速更新驅動,及時看到顯示卡性能的工作負載、虛拟攝像頭設定、自動生成遊戲高光時刻、還有讓每個人都能成為像是專業主播一樣的軟體設定等。其功能類似于NVIDIA的GFE面闆以及AMD的Radeon Software驅動軟體。

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

Arc Control 控制台是基于先進的圖層疊加技術,與作業系統無關,不太會占用處理器的工作負載而導緻影響整機性能,也不會中斷使用者原來正在進行的任務。使用者都可以随意進出Arc Control,可以通過快捷鍵一鍵互動,在使用方面十分便利。此外,Arc Control 控制台将提供便捷的安裝和自動更新服務,每當有新遊戲上架或遊戲釋出新驅動時,使用者會自動收到通知,如果使用者不想要被這些資訊打擾,也可以根據自己的需求靈活調整。

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

其次,銳炫 Control 控制台也會提供性能檢測,會以具體的參數和圖示給供使用者參考。這些具體的參數和圖示可以向使用者提供完整的GPU工作負載情況, 使用者可以根據自身需要做出适當調整。同時,也會有監測圖層彈窗浮動在遊戲上,使用者可以在打遊戲時看到整機的工作狀态。

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

Arc Control 控制台還提供便捷的直播、串流相關的功能和設定,使用者可以快速的開啟直播功能将遊戲精彩的畫面分享到直播平台上。通過快捷鍵,使用者可以快速開啟虛拟攝像頭将背景移除、自動調整畫面比例,并截取和儲存遊戲中的高光時刻。在釋出後,大概有10個遊戲左右支援抓取遊戲截圖或者視訊的功能。

需要注意的是,Arc Control 控制台适用于所有英特爾顯示卡,也是以不僅僅隻有英特爾的獨立顯示卡能用,英特爾的內建顯示卡也能用。

銳炫即将來臨

Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析
Xe-HPG登陸移動市場——英特爾銳炫移動獨顯解析

在本次釋出溝通會上,英特爾表示全球首款搭載銳炫顯示卡的筆記本是三星Galaxy Book2 Pro, 搭載銳炫 A350M,在部分地區已經開起預售,國内目前沒有該款産品。在英特爾的産品計劃裡,從超輕薄本到高性能遊戲本都有。從第二季度開始,采用銳炫 3系列的筆記本産品有望國内面市,銳炫 5和銳炫 7系列的産品有望在今年夏天釋出,價格從899美元起。喜歡嘗鮮的玩家們,可以期待了!

繼續閱讀