天天看點

PowerVR 7架構解析

作為對ARM Mali-T800系列的直接回應,Imagination日前正式釋出了新一代移動GPU PowerVR Series7系列,包括高端7XT、低端7XE兩個子系列。

下邊,我們就細細看看它的底層架構設計,并預覽一下性能。

PowerVR 7架構解析

【PowerVR 7架構解析】

本質上來說,PowerVR 7的架構還是“Rogue”,已經引入兩年。該架構有着先進的着色器流水線體系,沒什麼明顯缺點,短期内還無需徹底翻新,隻要局部增強、完善就可以提升效率和性能了,包括強化指令集。

PowerVR 7架構解析
PowerVR 7架構解析

當然,它還需要不斷加入新的功能特性,尤其是新的API。OpenGL ES 3.1早就支援了,但是蘋果的Metal來勢洶洶,作為回擊的Google Android Extension Pack現在是不能少的,還加入了可選項Direct3D 11.1(通俗地說就是DX11.1)。

但是注意7XT上這兩個都是标配,7XE上的AEP隻是可選項,Direct3D則隻到10.0。

PowerVR 7架構解析

這次唯一增加的新子產品就是“曲面細分協處理器”(Tessellation Co-Processor),可配合頂點資料管理器(Vertex Data Master)實作完整的曲面細分支援,但注意為了節省功耗,它是個固定功能單元,不可程式設計。

曲面細分、ATSC紋理壓縮、幾何着色、紋理着色,這些就是支援AEP的基礎。

其他子產品沒有大變但都有所增強,比如說頂點資料管理器(幾何前端)的幾何性能翻了一番,計算資料管理器(Compute Data Master)則提速了最多三倍,尤其适合處理大量的小核心。

粗紋理排程器(Coarse Grain Scheduler)降低了内部區塊關聯性,可以更快地向空閑核心(着色器簇/USC)發送指令,而不必等待其他核心完成工作。

PowerVR 7架構解析

USC核心本身變動很小,FP16/FP32 ALU、浮點單元都沒變,但是特殊功能單元(SFU)有了兩處明顯變化。首先也是最重要的,SFU可以原生處理FP16、FP32操作了(上代會全部推給FP32),是以在處理FP16資料集的時候不必進行無謂的高精度操作,自然能節省功耗,而且因為SFU本身已經很大了,原生FP16帶來的功耗節約會很明顯。

另外雖未明說,但極有可能FP16、FP32 SFU單元已經分離成了獨立的兩個(架構圖顯示一個),當然即便如此它們也不能同時使用。

第二個增強是SFU操作可以和ALU操作并發了,也就意味着兩個單元可以同時工作。Imagination表示,SFU代碼比預期得來得更快,是以并發會大大提高性能,為此指令集也做了相應的擴充。

此外,PowerVR 7系列還可選支援FP64操作,按照設計每核心有一個FP64 ALU。

PowerVR 7架構解析

最後是個非圖形功能,硬體加密區,使用虛拟化技術建立最多8個區域,彼此完全隔離,可進行不同的安全操作,并與CPU、GPU互聯。7XT會标配它,7XE上則是可選。

CPU上早就有了類似的功能,GPU上則一直是軟體模拟,效率低下,而且安全性不足。

PowerVR 7架構解析

【7XT/7XE:高低雙雄細節探究】

7XT是高端型号,但也有很多技術特性是可選的。FP64操作、OpenCL 1.2 Full Profile是面向高性能計算用途的(預設僅支援FP32、OpenCL 1.2 Embedded Profile),Direct3D 11則适合Windows Phone、Windows RT平台裝置(預設是Direct3D 10),但是曲面細分已經是标配。

通過靈活配置這些特性,SoC廠商可以精确滿足自己和客戶的需要,同時更好地控制面積和功耗。

PowerVR 7架構解析

其實相比于性能,能效才是7XT系列提升的重點。Imagination沒有給出任何具體資料(提升了百分之多少),隻是說7XT可以更低的功耗提供與6XT持平的性能,同時給了一張幻燈片,号稱自己有着全球最高的GPU能效。

證據就是自己的PowerVR長時間運作也幾乎不會降頻,競争對手的則會降低40-60%。

當然了,這能否實作還得看SoC廠商的設計,Imagination隻能提供最基本的建議。人家非要把CPU、GPU頻率弄得很高,跑着跑着就會過熱降頻,你也沒轍。

PowerVR 7架構解析
PowerVR 7架構解析

7XT系列的核心可選2-16個,比上代最多翻了一番,具體型号分别是:雙核心GT7200、四核心GT7400、六核心GT7600、八核心GT7800、十六核心GT7900。

很有意思的命名吧?Imagination甚至說GT7900的性能已經可以超越入門級筆記本獨顯GeForce GT730M。GT7400/GT7600則是上代主機Xbox 360、PS3的水準。

用途方面,2-4個核心的适合手機,6-8個可用于平闆機、汽車、超極本,16個的隻有筆記本電腦、機頂盒、遊戲機、伺服器才敢用——512個FP32 ALU單元差不多可以媲美入門級桌面獨立顯示卡了。

目前的6XT系列裡,iPhone6用到的GX6450是四個核心,iPad Air 2裡的GX6650旗艦型号六個核心。

PowerVR 7架構解析

7XE定位于入門級,規格、成本都很低,并且更強調面積上的效率,而不是功耗。

PowerVR 7架構解析

7XE其實也有着7XT相同的架構改進,可以支援7XT的幾乎所有技術,但絕大部分都是可選項,包括DirectX 11、曲面細分(AEP自然也是可選了)、紋理壓縮、HEVC/H.265解碼、10-bit YUV色彩輸出、虛拟化安全。OpenCL 1.2 FP都直接不可選。

PowerVR 7架構解析
PowerVR 7架構解析

7XE有兩個版本,一個核心的GE7800面向低端手機和電視,半個核心的GE7400則面向最便宜、最簡單的裝置,以及可穿戴裝置。

Imagination聲稱,7XE的功耗滿載也不會超過1W,待機時幾乎可以忽略不計。

【性能咋樣?】

真正使用PowerVR 7系列的處理器、裝置要明年底才會出現,而我們都知道,ARM、Imagination他們都隻是賣CPU、GPU授權,具體什麼樣子還得看SoC晶片廠商的選擇,包括核心數量、技術特性、制造技術、運作頻率等等,是以現在是無法說清性能的,隻能有一個大概的預估。

PowerVR 7架構解析

Imagination宣稱,在同樣核心數量、同等頻率下,7XT系列的性能可比6XT系列提升35-60%,如果真能實作是很猛的,但這也意味着功耗會增加很多,是以最終在考慮功耗的前提下,性能提升絕對不會這麼高,而且這隻是理論測試,實際應用中又會打個折扣。

PowerVR 7架構解析

而在能效方面站出來的是7XE,官方号稱相比6XE提升幅度少則40%,多則可以超過100%。

結語:

PowerVR 7系列可以配置出各種不同的版本,最高最低相差32倍,是以理論上适合各種各樣的裝置,從智能手表、手環到筆記本甚至是伺服器計算叢集。

PowerVR 7架構解析

PowerVR 6系列是CES 2014大展上宣布的,最近才剛剛投入實用,iPhone6/iPhone6 Plus、iPad Air 2就是典型代表。PowerVR 7系列的零售産品預計會在一年後面世,正好就是下一代iPhone、iPad釋出的視窗,而按照蘋果與PowerVR的一貫良好合作關系,iPhone7(iPhone6s)幾乎必然會用PowerVR 7,而且說不定會有6個核心。

ARM Mali-T800、高通Adreno 400、NVIDIA麥克斯韋……明年的移動GPU,注定會精彩異常。

繼續閱讀