天天看點

探夢方寸間 移動終端CPU、GPU淺析

清晨,你的第一聲叫醒鬧鐘往往來自手機;在出門前,你更願意在你的背包中裝入一部iPad,而不是筆記本電腦;旅途中,你希望可以用NDSL和移動網際網路來打發漫長的時光……在2010年之前,我們總是習慣從“數位”類的功能角度去了解和選購它們,不過,情況正在發生變化。正如傳統PC市場一樣,這些同樣基于馮?諾依曼體系的“微型計算機”移動終端,核心CPU和GPU配置正成為評價其性能的重要實體參數。不同的是,這不是x86處理器和PC顯示卡的帝國,它們是ARM的領地。本期,MC将帶領各位一窺它的秘密。

ARM是誰?

我們對傳統PC市場的CPU如數家珍,英特爾、AMD和威盛包攬了整個市場。由英特爾創始人之一摩爾提出的摩爾定律推動了這個市場技術的進步,英特爾的Tick-Tock線路圖即是基于此而建立:工藝-核心的交替更新步伐。然而,不論是最早的奔騰,還是現在最新的酷睿i7,這些處理器都基于一個稱之為x86的架構中——由最早的英特爾8086指令集擴充組成,因英特爾早期CPU的型号為80x86而得名。在計算機學術界的分類中,x86架構被列在CISC(複雜指令集)類之下。

指令是CPU能聽懂的語言,正如人類的語言一樣,詞彙越豐富,表達就越容易,一定程度上,傳達内容的方式就越高效。這也是為什麼在20世紀80年代,x86架構盛行的原因之一。不過,語言上也有常用字和生僻字之分,80%的常用字在整個語言文字中所占比例其實很小,CPU指令也如此。研究發現,80%的常用指令來自CISC的20%,于是,另一類稱之為RISC(精簡指令集)的門類誕生了,ARM架構即基于此類——和x86一樣,ARM架構也因ARM公司是其創造和維護者而得名。

探夢方寸間 移動終端CPU、GPU淺析

CISC指令複雜強大,但執行過程也更複雜耗時,功耗更多。

CISC強大高效,RISC簡潔容易,這本是兩個不同的指令集類别,與應用無關。各種談論x86難以落腳移動終端的最大原因是功耗,為什麼憑借英特爾的技術,功耗上x86始終無法與ARM架構抗衡呢?這有英特爾的原因,也有指令集的影響。

英特爾成功的要素之一是向前相容性——至少到目前為止,英特爾設計的所有x86 CPU都相容以前任何一老款CPU的指令和應用。這是程式開發人員的福音,不過卻造成了CPU結構的複雜化,而CISC指令的硬體實作也需要更多的半導體,這些半導體不僅僅是對制造技術的考量,也是對能耗控制的考量。要知道工作中是要消耗電力的,即便是那些80%不會被常用到的指令硬體也必須加電等待偶爾的調用;而基于RISC的ARM架構則要輕松得多,它的指令集相對很少,所需要的半導體也更少,而且由于使用等長的指令(16位和32位),與x86的可變長指令(最長指令可達128位)相比,處理也更加容易,功耗自然更低。這是一個功耗和性能的博弈,在功耗要求嚴格的移動終端處理器市場,RISC的ARM最終勝出。

ARM與x86處理器的差異

指令集是ARM與x86架構的本質差別,正如你無法用英語與一個隻會說漢語的人溝通一樣。是以,不同的架構需要與之比對的作業系統。目前的Windows 7無法運作在ARM上,而iOS、Android等移動終端作業系統也無法直接在x86硬體上運作。指令集的不同造成了處理器在硬體實作上的不同,比如,ARM處理器大量使用寄存器(多達37個)和CPU内緩存(cache)對指令進行操作,通過流水線和超标量技術,一個時鐘周期可以執行一條以上的指令,十分高效;而x86處理器僅有8個通用寄存器,通過讀寫外部存儲器來調用指令(為了向前相容),可能需要幾個時鐘周期才能完成一條指令,效率較低。有資料稱,在同樣的制造技術前提下,英特爾CPU頻率每提升1%,功耗要提高2至3%,而ARM則可以保持不變,甚至更低。

探夢方寸間 移動終端CPU、GPU淺析

ARM與x86處理器的另外一個差別為,ARM處理器并不像x86那樣單顆使用。它總是與其他晶片封裝在一起,諸如DSP晶片、顯示晶片、通訊晶片等等。英特爾和AMD終于于2011年推出CPU與GPU完整融合的處理器,其實在很早之前,ARM處理器已經這樣幹了。ARM處理器通過一條稱之為AMBA的片上總線可随意挂載各種标準晶片,包括其他的ARM核心。成品ARM CPU通常都是內建了晶片組和各種功能晶片的一體式晶片,稱為片上系統(SoC),功能和一塊內建了CPU和顯示卡的x86架構主機闆相當,外圍隻需要連上電源、存儲、通訊和顯示裝置即可工作,這樣的晶片尺寸隻有十幾個平方毫米,不到一塊x86處理器大小!

探夢方寸間 移動終端CPU、GPU淺析

Ti OMAP4430與英特爾x86 P67 blockdiagram對比,ARM晶片絕大部分采用All in one的片上系統(SOC)。

ARM的核心

正如x86架構可以通過核心來判斷CPU性能和新舊程度一樣,ARM CPU也有不同的核心,隻是核心更新沒有x86如此頻繁(x86基本兩年更新一次)。從1983年開始,到目前為止,ARM核心共有ARM1、ARM2、ARM6、ARM7、ARM9、ARM10、ARM11和Cortex以及對應的修改版或增強版組成,越靠後的核心,初始頻率越高、架構越先進,功能也越強。目前移動智能終端中常見的為ARM11和Cortex核心,如諾基亞N8使用的即為主頻680MHz的ARM11核心,Cortex主要用于高端和多核處理器上,如NVIDIA的Tegra 2就是由兩顆1GHz Cortex-A9核心組成。

探夢方寸間 移動終端CPU、GPU淺析

ARM處理器經典核心及Cortex應用核心

ARM11架構釋出于2002年,基于ARMv6指令集,包括ARM1136J、ARM1156T2和ARM1176JZ三個核心型号,其中字尾帶J的表示支援Java代碼硬體加速,T則表示支援Thumb-2指令。ARM11采用8級流水線,能夠支援多核架構。在使用130nm制程下即可獲得低至0.2mW/MHz的功耗比和500MHz的主頻,而目前工藝條件下,已有1GHz主頻産品出現。ARM11處理器系列面向多種手持電子消費品市場,推出了許多新的技術,包括針對媒體處理的SIMD,與ARM9相比,ARM11對于MPEG4的編解碼算法速度提高了一倍;用以提高安全性能的TrustZone技術;智能能源管理(IEM)等,同時,ARM11還改變了緩存的結構,使用實體位址對緩存進行索引,并加入了動态分支預測功能。

探夢方寸間 移動終端CPU、GPU淺析

ARM核心及制程發展線路圖

Cortex核心釋出于2004年,最早的型号是Cortex-M3;Cortex-A8核心于2005年10月4日釋出,随後ARM在2006年5月15日釋出了Cortex-R4核心。這三款核心分别面向不同的領域,移動智能終端上使用的絕大多數為Cortex-A8核心。Cortex-A8核心的DMIPS名額達到了2.0DMIPS/MHz,相比ARM11取得了巨大的進步(ARM11為1.17DMIPS/MHz)。Cortex-A8處理器在大幅提高性能的同時,依然保持了低功耗優勢,譬如說,一顆含有32KB一級緩存,256KB二級緩存的Cortex-A8處理器,在使用600MHz的主頻時,總功耗僅為300mW。Cortex-A8還引入了NEON部件,NEON的功能與英特爾的SSE指令集類似,用于支援SIMD類指令。Cortex-A8還可以在每個時鐘周期内并行發射兩條指令,是首個ARM超标量體系核心。為了進一步提高時鐘頻率,Cortex A8核心使用了13級的整型指令流水線和10級NEON指令流水線,并改善了了指令分支預測的命中率,從ARM11的88%提高到Cortex A8的95%。此外,Cortex-A8在緩存的設計中,首次引入了Way-Prediction(關聯路徑預測),可根據預測關閉暫時不使用的緩存,降低處理器功耗。英特爾從Pentium M處理器時代起使用了這種緩存通路方式,并一直應用到x86處理器的後續産品中。Cortex-A8還可以使用64位或者128位總線連接配接外部裝置。Cortex-A8不支援多核架構,多核超标量核心為Cortex-A9,而最新的多核核心則為Cortex-A15。

2011年初,ARM Cortex-A15核心釋出,主要是針對多核進行了優化。Cortex-A15處理器可運作在2.5GHz,能夠在不斷壓縮的能耗、散熱和成本預算範圍内提供高度內建的可擴充性解決方案。Cortex-A15計劃以32nm、28nm工藝生産,目前尚無成品産出。

與x86處理器僅對微架構的關注不同的是,影響ARM處理器性能的還有指令集版本。為提高處理器性能,ARM先後釋出了7個版本的指令集,分别為ARM V1至ARM V7,不過指令集版本并不與核心對應,如ARM9核心使用的為ARM V5版指令集,而ARM11使用為ARM V6,最新的Cortex核心使用的才是ARM V7版指令集,表1列出了不同核心對應的指令集版本。新版指令集是對舊版的修定和增強,不一定相容之前的版本,但在多媒體和複雜應用方面性能會大增。事實上,在ARM處理器當中,指令集版本的高低更能辨識出處理器性能的優劣。

表1:ARM指令集與核心對應簡略表

探夢方寸間 移動終端CPU、GPU淺析

移動終端上的GPU

GPU是NVIDIA最先提出的概念,與CPU相比,它并沒有什麼大的架構之分,GPU的設計主要遵循幾個圖形加速标準:OpenGL和DirectX行業标準,隻是各家的實作方式不同,反應在實際應用中,表現為性能和功耗的差異。移動終端上的主要GPU供應品牌為PowerVR的SGX系列、高通(QUALCOMM)Adreno系列、博通(Broadcom)BCM系列、NVIDIA Tegra和ARM自家的Mali圖形處理單元。具體性能參數見表2。

表2:主流移動GPU性能參數一覽

探夢方寸間 移動終端CPU、GPU淺析

點選檢視清晰大圖

移動裝置中應用最廣的GPU是PowerVR SGX系列,目前型号已經發展到SGX555。PowerVR圖形處理器在20世紀90年代曾是3dfx Voodoo的主要競争對手,在後來的市場競争中,這兩個品牌都從PC市場消失了,PowerVR轉入了移動GPU領域。這家隸屬于Imagination Technologies公司的廠商采用了與ARM公司相同的技術授權方式,向各大晶片制造商出售硬體授權,自身并不生産晶片。它的産品當中,最耀眼的一員,當屬iPad 2采用的PowerVR SGX 543MP2圖形處理器,據稱相對于iPad一代的PowerVR SGX 535有高達9倍的性能提升。

探夢方寸間 移動終端CPU、GPU淺析

PowerVR SGX系列發展線路圖

在移動裝置中應用第二多的是高通Adreno GPU,至今已經釋出了幾款産品,包括Adreno 130、Adreno 200、Adreno 205、Adreno 220、Adreno 300。不過高通并不出售自家的圖形晶片,也不對外授權,隻在自己的晶片組中使用,主要應用在Snapdragon系列晶片組上,也是目前移動智能終端上使用最多的晶片組。

探夢方寸間 移動終端CPU、GPU淺析

高通adreno系列GPU性能類比

博通的GPU産品很少,大家更熟悉的可能是其在PC領域的網卡晶片。到目前為止,它一共發售了兩款GPU,分别為BCM2727與BCM2763,多媒體性能極為強大。

博通GPU内置了采用Broadcom VideoCore III技術的多媒體處理器,基于雙核心矢量處理器,不僅更有利于3D/2D圖形處理,支援高達1200萬像素的數位相機,同時還能保持非常低的功耗。利用該晶片上的HDMI接口,更是可以直接向大螢幕輸出高清視訊與3D遊戲畫面。隻要看看諾基亞N8這款基于ARM11舊核心産品的多媒體和遊戲表現,就能體驗到BCM系列GPU的強大。

探夢方寸間 移動終端CPU、GPU淺析

采用博通BCM2727 GPU的諾基亞N8(黃色框部分)

NVIDIA是PC平台上主要的圖形晶片供應商,不過與高通一樣,它們也不出售和授權自家的移動終端GPU,NVIDIA的GPU主要應用在自家的Tegra移動晶片上。如Tegra 2采用就是自家的ULP GeForce架構,包含8個CUDA處理器,支援OpenGL ES2.0以及可程式設計等特性,1080p的高清視訊編碼與解碼更是它的長項,性能極其強大。遺憾的是,目前還沒有終端産品可以将其性能發揮到極緻,隻有通過《地牢守護者》這種硬體要求較為“變态”的遊戲中才能體會到它在圖形處理上的強大。

探夢方寸間 移動終端CPU、GPU淺析

使用Tegra2平台運作《地牢守護者》的遊戲畫面

作為處理器方案供應商的ARM同樣也有GPU的授權,其旗下GPU已經發展到Mali400系列,不過采用的廠商很少,主要用在廉價的SoC體系上,如Telechips的TCC8902,瑞芯微RK2818等,尚未進入主流。

移動終端上的GPU與PC上的GPU并沒有很大差別,它們遵從相似的标準,不同的是,基于移動終端的低功耗要求,它們的性能很難與PC上的GPU相媲美,如NVIDIA Tegra上配備的GeForce GPU僅僅隻是PC版GeForce的精簡版。不過受益于圖形标準的完善和PC顯示卡技術的發展,移動終端GPU的發展速度和性能正快步向前。

ARM的晶片商

盡管有資料稱ARM處理器已經占據了移動終端90%的市場佔有率,但ARM公司自身并不生産CPU晶片,它們隻是專注于開發新指令集,進行CPU核心方案和相關應用、調試工具的開發,然後将這些方案授權給半導體和晶片生産商,并收取授權費。是以ARM處理器的生産商可謂遍布全球,這與英特爾和AMD的生産方式完全不同。ARM的主要晶片生産方包括高通、德州儀器(Ti)、三星和NVIDIA,另外Marvell、飛思卡爾、南韓Telechips和中國的瑞星微也有生産,還有一些其他生産商分布在工業控制領域。

高通
探夢方寸間 移動終端CPU、GPU淺析

高通處理器家族概況一覽

在PC領域可能很少聽到高通的名字,但在通訊界,其名号如雷貫耳。高通是少數從一開始就發現ARM價值的移動硬體供應商。從20世紀末,ARM還深陷财務泥沼中時,高通就開始了與其的研發合作,到2002年前後,高通公司率先購買了ARM新型微處理器核心授權,成為了 ARM的重要合作夥伴。

高通前任CEO桑傑?賈擺脫了高通不雅的“CDMA專利收稅官”的帽子,在晶片技術上突飛猛進,一躍成為ARM處理器的上司者。高通ARM處理器的代表作為SnapDragon,第一代型号為 QSD8250/8650,采用65nm工藝制成,内置Adreno 200 GPU。晶片擁有獨立的視訊子系統,支援720p/H.264視訊的編碼和回放,也是業界第一款頻率達到1GHz的ARM處理器。Snapdragon處理器的核心為Scorpion,是高通特别為ARM的Cortex-A8核心添加了更好的多媒體指令和電源管理功能之後的修改版。

2010年第二季度,高通又推出了Snapdragon處理器的第二代,主要型号包括MSM7230、MSM8x55等,高通的處理器型号命名比較複雜,很難從型号命名上區分代數,一般區分第二代CPU的辦法是看制程和内置GPU,45nm制程,Andreno 205 GPU配置的基本都屬于第二代。第二代Snapdragon主要優化了多媒體和3D性能,在功耗上也進行了微調,市面代表産品有HTC Desire Z(MSM7230)、HTC Desire HD(MSM8255)。

第三代Snapdragon為雙核産品,處理器型号MSM8x60,目前已釋出的有MSM8260和MSM8660,45nm工藝,雙核心,最高1.5GHz,強化了Web浏覽和多媒體表現,提供HSPA+高速無線資料連接配接,内置的是Adreno 220 GPU。這一代Snapdragon處理器還包括一款四核産品APQ8060,它主要面向平闆電腦市場。值得注意的是,目前市面上尚沒有使用這些CPU的産品出現。

盡管第三代Snapdragon處理器尚未在市面上鋪開,代号為Krait的下一代Snapdragon移動處理器業已曝光,28nm工藝制造,全部采用新一代Adreno 320 四核GPU,支援3D顯示和拍照,可以通過HDMI輸出1080p視訊,有單核、雙核和四核産品,功耗降低65%,主要型号包括MSM8930(單核)、MSM8960(雙核)、APQ8064(四核(應該是MSM8X60的AP Only版本,不是四核))。

表3:高通常用ARM晶片參數

晶片型号

CPU

核心

核心

制程

工藝

主頻

I/D 

Cache

L2 Cache GPU
QSD8250 1 Scorpion 65nm 1GHz 不詳 不詳 Adreno 200
MSM7230 1 Scorpion 45nm 800MHz-1GHz 不詳 不詳 Adreno 205
MSM8255 1 Scorpion 45nm 1GHz 不詳 不詳 Adreno 205
MSM8260 2 Scorpion 45nm 1.2GHz 不詳 不詳 Adreno 220
三星

早在Windows Mobile時代,三星就有ARM處理器問世,如型号為S3C24XX的系列,不過性能并不出色,直到蘋果iPhone搭載了由其生産的S5L8900(基于ARM1176JZF-S)之後,才逐漸名聲大振。

在iPhone 3GS上,蘋果繼續使用了代号為蜂鳥(Hummingbird)的S5PC100處理器,該處理器基于Cortex-A8核心,頻率600MHz至800MHz,提供[email protected]級别的MPEG-4/H.263/H.264以及MPEG-2/VC1/Xvid的硬解碼,性能強悍。

 表4:三星常用ARM晶片參數

晶片

型号

CPU

核心

核心

制程

工藝

主頻

I/D 

Cache

L2 

Cache

GPU
S5PC110 1 Cortex-A8 45nm 800MHz-1GHz 32/32KB 512KB SGX540
S5PC100 1 Cortex-A8 65nm 600-833MHz 32/32KB 512KB SGX530
Exynos 4210 2 Cortex-A9 45nm 1GHz 32/32KB 1MB Mali-400
Apple A4 1 Hummingbird 45nm 800MHz-1GHz 32/32KB 640KB SGX535

而業界使用較多三星ARM處理器主要是采用Cotrex-A8核心的兩款,其中一款為S5PC100,另一款為S5PC110。S5PC110的主頻為800MHz至1GHz,采用45nm工藝,具備[email protected]的視訊硬加速能力,支援1200萬像素攝像頭,内置PowerVG SGX540 GPU,提供HDMI 1.3數字視訊輸出接口,三星自家的Galaxy S手機及Galaxy Tab平闆即采用的此款晶片。有意思的是,蘋果A4處理器的編号為S5PC110A01,與S5PC110僅有字尾編号的差異,在硬體結構上,兩者基本一樣。

探夢方寸間 移動終端CPU、GPU淺析

德州儀器的雙核晶片組結構圖

此外,三星官方網站還提供一款型号為Exynos 4210的晶片資料,基于Cotrex-A9雙核架構,主頻1GHz,但目前顯示隻有樣片,并未量産。Exynos 4210提供1MB L2緩存,支援WXGA分辨率及30fps 1080p視訊解碼,還支援3D視訊和攝像頭,GPU具體型号不詳。它應該屬于去年底媒體報道的代号為Orion“獵戶座”的雙核産品。

德州儀器

德州儀器是ARM晶片的重要授權制造商之一。早在7年前,諾基亞與德州儀器的合作,就造就了諸多經典的智能手機産品,包括了主打遊戲的N-Gage系列。摩托羅拉、LG、三星等國際廠商都是其大客戶。德州儀器的ARM晶片編号為OMAP(Open Multimedia Application Platform,開放多媒體應用平台),常見的為OMAP 3XXX系列,其中最熱門的型号為OMAP 3430,标準主頻550MHz,采用65nm工藝,搭載IVA2+硬體引擎的情況下,可以解碼480p的H.264、WMV9和RM視訊,部分格式還可支援至720p級别。該晶片内置PowerVR SGX530 GPU,最高可支援1024×768像素、1600萬色的顯示。此外,這款處理器的超頻能力極佳,在少量提升電壓的情況下,可輕松超頻至1.2GHz運作,摩托羅拉裡程碑即采用此款晶片,遺憾的是精簡了部分IVA 2+引擎,視訊解碼性能是以驟減。

另一款應用較多的為OMAP 3640,使用45nm工藝,設計主頻1GHz,可輕松超頻至1.2GHz運作,摩托羅拉ME811智能手機即運作在此頻率下,屬于目前單核産品中的旗艦型号。OMAP 3640同樣搭載IVA 2+多媒體引擎,可解碼720p視訊,此外它還加入了安全子產品和新的電源管理子產品,更加節能。OMAP3640同樣内置PowerVR SGX530 GPU,遊戲體驗出色。

OMAP晶片一直深得玩家們的喜愛,但由于處理器頻率上不去,也一直是玩家們心中的痛,是以在目前“GHz級”處理器浪潮中,被高通等廠商搶去不少風頭。不過在2011年,德州儀器宣布推出全新的OMAP 4系列移動應用平台,不僅把處理器頻率提高,還可提供令人驚豔的全新多媒體體驗,例如1080p的視訊錄制及播放,2000萬像素拍攝,以及支援長達約1周的音頻播放時間。廠商宣稱,新平台可讓Web 頁面的加載加快10倍、計算性能提高7倍、視訊分辨率提高6倍、圖形性能增強10倍、音頻播放時間延長6倍等。更高端的OMAP 5系列晶片也在規劃中,基于Cortex-15核心的多核支援,PowerVR SGX544-MPx多核心GPU,IVA-HD硬體加速,具備3D和1080p視訊解碼能力,采用28nm工藝,令人期待。

表5:德州儀器常用ARM晶片參數

晶片型号 CPU核心 核心 制程工藝  主頻 I/D Cache L2 Cache GPU
OMAP3430 1 Cortex-A8 65nm 550MHz 32/32KB 不詳 SGX530
OMAP3630 1 Cortex-A8 45nm 720MHz 32/32KB 不詳 SGX530
OMAP3640 1 Cortex-A8 45nm 1GHz 32/32KB 不詳 SGX530
OMAP4430 2 Cortex-A9 45nm 1GHz 不詳 不詳 SGX540
NVIDIA

在移動市場上,NVIDIA所生産的ARM晶片遠不如它在PC市場的顯示晶片那麼有名。NVIDIA在2006年推出了Tegra(圖睿)子品牌,針對移動終端市場,但卻并非一帆風順,使用者幾乎看不到具體的産品。直到2008年,第一代有“實物”的Tegra處理器才出現。第一代Tegra共分為兩大系列,分别為Tegra APX系列和Tegra 600系列,其中APX系列針對于智能手機平台,而Tegra 600系列則針對于MID的計算機系統。2個系列均基于ARM11架構,其競争對手是英特爾Atom處理器。最初的Tegra包括一顆800MHz的ARM CPU、一顆HD video處理單元、一顆圖像處理單元、一顆音頻處理單元以及一顆低電壓版本GeForce GPU。

探夢方寸間 移動終端CPU、GPU淺析

使用Tegra2晶片的摩托羅拉XOOM平闆主機闆

在苦心經營了兩年半之後,也就是Tegra 2釋出一年之後的2010年,NVIDIA Tegra處理器終于迎來了自己的春天,Tegra 2 1GHz雙核處理器讓NVIDIA一戰成名。于是,來自平闆機、智能手機、車載電子裝置的訂單不斷。第一款支援Tegra 2晶片的手機為LG Optimus 2X。Tegra 2在第一代産品的基礎上将高清播放能力提升到1080p的水準,同時增加了1080p高清編碼能力,另外在多媒體方面增加了對Flash 10的支援,内部一共整合了8個CUDA處理器來實作不同的功能,可以實作超過140小時的音樂播放、12小時的1080p視訊播放以及6小時的網際網路高清媒體播放,并且價格也十分低廉。Tegra 2獲得了包括宏碁、華碩、HTC、LG電子、微星、摩托羅拉、三星電子的青睐,甚至中國内地山寨平闆也将大批訂單抛向了Tegra 2,一時之間,Tegra 2俨然成為平闆時代的首選晶片。

探夢方寸間 移動終端CPU、GPU淺析

網絡洩露的NVIDIA tegra發展線路圖

根據網上洩露的Tegra線路圖,在今年第三季度NVIDIA還将釋出四核處理器Tegra 3,這款四核處理器Tegra 3除了變成1.5GHz及四核心之外,還将圖形性能提升了三倍,并且Tegra 4也被提上了日程。

其他

相對前述耀眼的四大品牌,包括Marvell、飛思卡爾、Telechips和瑞星微這樣晶片商市場佔有率要小得多,産品也大部分集中在低端領域。Marvell對ARM晶片的技術來自英特爾,2006年,英特爾将Xscale處理器打包出售給了Marvell,不過Marvell隻是汲取了Xscale的技術,而并沒有将這一系列發揚光大,推出的産品較少,常見的為PXA930,采用65nm技術(PXA935為45nm),基于Marvell自己的Sheeva核心,提供對ARMv5TE、ARMv6、ARMv7指令集的支援,沒有内建GPU,在中國移動的第一代OPhone中廣泛采用。

表6:NVIDIA常用ARM晶片參數

晶片型号

CPU

核心

核心

制程

工藝

主頻

I/D 

Cache

L2 

Cache

GPU
Tegra 2 2 Cortex-A9 40nm 1GHz 32/32KB 1MB ULP GeForce
Tegra APX 1 ARM11 MPCore 65nm  750MHz 32/32KB 32/32KB GeForce 6

飛思卡爾常見型号為i.MAX515,基于ARM CortexA8核心,運作頻率800MHz,内置ARM Mali200 GPU,提供OpenGL ES 2.0與OpenVG 1.1硬體加速,多模HD 720p視訊解碼器和D1視訊編碼器硬體引擎,主要用在一些國産平闆電腦中。

Telechips的主要晶片為TCC890X,基于ARM1176JZF-S核心,内置圖形處理單元,具備HDMI輸出和部分格式的1080p視訊解碼能力,在一些國産低端PMP中廣泛應用;瑞芯微RK2818采用ARM9核心,基于65nm制作工藝,頻率為624MHz,搭配256M DDR2記憶體,同時配備了600MHz的Ceva MM2000獨立DSP硬解碼器。RK2818支援RV、H.264、VC-1、H.263、MPEG4等編碼格式,最高支援到720p。RK2818并未内置GPU,而是使用Android Pixelflinger渲染器,這是一個軟體渲染器,通過ARM核心來軟體渲染3D畫面,速度會比較慢,隻能玩一些簡單的3D遊戲。國産藍魔W11等平闆均使用此晶片。

幸運的ARM

ARM全稱Advanced RISC Machine,于1990年11月由Acorn、蘋果和VLSI共同出資建立,确切地說,應該叫更名,因為蘋果和VLSI隻是投資,而實際運作方其實是Acorn RISC Machine(即Acorn)。Acorn RISC Machine在1978年由Andy Hopper、Chris Curry和Herman Hauser共同建立。Acorn最初使用MOS Technology 6502處理器(當時業界功效最強,且極為廉價的處理器)研發嵌入式系統,與其他同類型的小科技公司沒什麼兩樣,并且還小有成就。1980年代,英特爾x86架構異軍突起,給當時所有的處理器廠商以毀滅性打擊,Acorn也不例外,他們希望投入英特爾門下,使用x86架構進行開發。不幸的是,當他們向英特爾索取80286處理器樣片時,卻遭到了拒絕。無奈之下,1983年10月,Acorn啟動了代号為Acorn RISC的項目,由VLSI Technology負責生産。1985年4月26日,VLSI産出第一顆Acorn RISC處理器ARM1,僅有個25000個半導體,甚至沒有乘法部件。在英特爾80386的光環下,無人問津。

Acorn不得不調整處理器的設計理念:廉價、低功耗、高性能!——20多年後,這一理念與智能手機和平闆電腦不謀而合。因為對廉價和低功耗的追求,Acorn選擇了RISC;同時,也因為要有機會,必須與英特爾不同。

然而,Acron的步伐依然緩慢,且财務拮據,直到蘋果和VLSI注資組建ARM前,12個員工還擠在谷倉中辦公,因為沒有資金自己生産晶片,他們轉而尋求隻負責晶片的設計,通過授權的方式出售晶片設計,這種授權商業模式直到1993年後才逐漸顯示出活力——1993年,Cirrus Logic和德州儀器公司先後加入ARM陣營,德州儀器為ARM帶來了命運的轉機,它說服了當時一家并不知名的芬蘭公司與他們一道進入通信移動市場,這家公司叫諾基亞。通過與諾基亞和德州儀器的合作,ARM發明了16位Thumb指令集,真正意義上建立了基于ARM/Thumb的SoC商業模式,逐漸擺脫财務危機,業務不斷擴大。

1995年,著名處理器制造商DEC獲得了ARM的全部指令集授權,開始研發StrongARM CPU。DEC在StrongARM處理器設計中注入了許多Alpha處理器的先進元素,使ARM處理器達到了前所未有的高度。1997年,由于英特爾與DEC的專利官司,DEC将StrongARM的所有技術轉讓給了英特爾。這就是21世紀初風靡全球的英特爾Xscale(基于StrongARM)處理器。英特爾的處理器技術極大地促進了ARM核心的發展,并一舉擊敗了當時紅遍全球的摩托羅拉半導體68K處理器。2006年,英特爾業績跌入低谷,當時的英特爾CEO貝瑞特不得不作出了一個艱難的決定,将PXA系列處理器出售給了Marvell。此時的ARM已經汲取了足夠的能量和優秀理念,開始朝嵌入式和移動終端領域進發。核心授權模式讓半導體和晶片生廠商們進入處理器制造領域的難度銳減,加入ARM陣營的制造商越來越多。而此時,x86陣營再想在手持裝置領域與之競争,卻發現,這個名叫ARM的對手擁有遍布全球的晶片制造商。自此,ARM在移動終端領域一騎絕塵。

DEC、英特爾還有很多其他的處理器和晶片開發商,都曾是ARM需要與之競争的對手,然而,正是這些對手為ARM處理器注入了新的設計理念、新的技術和活力。ARM應該感謝它們,沒有這些對手的努力,或許也沒有ARM的今天!

轉自:http://blog.csdn.net/billowszpt/article/details/6569095

繼續閱讀