天天看點

ARM 處理器

ARM Cortex系列組合大體上分為三種類别:

    ● Cortex-A—面向性能密集型系統的應用處理器核心

    ● Cortex-R—面向實時應用的高性能核心

    ● Cortex-M—面向各類嵌入式應用的微控制器核心

    Cortex-A處理器為利用作業系統(例如Linux或者Android)的裝置提供了一系列解決方案,這些裝置被用于各類應用,從低成本手持裝置到智能手機、平闆電腦、機頂盒以及企業網絡裝置等。

    盡管Cortex-A5核心是Cortex A系列中體積和功耗都最低的成員,但它擁有支援多核性能的潛能,并且與該系列中的進階成員(A9和A15)相容。

    Cortex-A7在功耗和體積上與Cortex-A5相似,但其性能提升20%左右,且與Cortex-A15和Cortex-A17有完全的架構相容性。Cortex-A7是成本敏感型智能手機和平闆電腦的理想選擇,而且它還可以與Cortex-A15或Cortex-A17組合使用,形成ARM稱為“big.LITTLE”的處理結構。big.LITTLE結構實質上是一種功耗優化技術;高性能CPU(例如Cortex-A17)和高效率CPU(例如Cortex-A7)的組合配置能夠提供更高的持久性能,同時因為更高效的核心很好的滿足了應用對中低性能的需求,這種組合還顯著節省整體功耗,節省75%的CPU耗能,并且延長電池的使用壽命。智能手機和平闆電腦的性能需求發展遠比電池容量的增長快得多,是以這種配置帶給開發人員明顯的優勢。諸如big.LITTLE等設計方法,作為整體系統設計政策的一部分,能夠顯著降低這種電池技術造成的差距。

    接下來讓我們看看Cortex-A系列處理器中的進階别産品——Cortex-A15和Cortex-A17核心。這兩款核心都是高性能處理器,也可用于多種配置中。Cortex-A17是最高效的“中級”處理器,直接針對高端智能手機和平闆電腦。Cortex-A17能夠配置多達四個核心,每個核心都包含一個完整的亂序流水線。還可以搭配高端移動圖形處理器(例如來自ARM的MALI),構成非常高效的設計整體。

    Cortex-A15是該系列處理器中性能最高的成員,是Cortex-A9性能(移動配置模式)的兩倍。不僅完全勝任高端智能手機或平闆電腦這樣的應用,而且運作速率可高達2.5GHz的多核Cortex-A15處理器也能夠支撐低功耗伺服器或無線基礎設施等應用。Cortex-A15是ARM公司第一款對虛拟軟體環境中的資料管理和仲裁提供硬體支援的處理器。這些軟體環境中的應用能夠同時通路系統資源,實作虛拟環境中裝置的可靠運作和互相隔離。

    最新成員Cortex-A50系列将Cortex-A系列的應用範圍擴大至低功耗伺服器領域。這些處理器基于ARMv8架構,支援AArch64——高效能64位運作态且可以與現行32位運作态共存。更新到64位的原因之一顯而易見是為了支援大于4GB的實體記憶體,盡管Cortex-A15和Cortex-A7已經具備此能力。在這種情況下,更新到64位其實是為伺服器應用提供更好的支援,伺服器中越來越多的作業系統和應用程式都采用64位,當然,Cortex-A50系列為上述情況提供了功耗優化的解決方案。對于桌上型電腦市場而言,情況也大體相同,支援64位意味着Cortex-A50系列能夠更廣泛地應用到這一細分市場,而且某種程度證明了未來64位作業系統最終将遷移到移動應用。

    介紹過Cortex-A,下面介紹Cortex-R系列——衍生産品中體積最小的ARM處理器,這一點也最不為人所知。Cortex-R處理器針對高性能實時應用,例如硬碟控制器(或固态驅動控制器)、企業中的網絡裝置和列印機、消費電子裝置(例如藍光播放器和媒體播放器)、以及汽車應用(例如安全氣囊、制動系統和發動機管理)。Cortex-R系列在某些方面與高端微控制器(MCU)類似,但是,針對的是比通常使用标準MCU的系統還要大型的系統。例如,Cortex-R4就非常适合汽車應用。Cortex-R4主頻可以高達600MHz(具有2.45DMIPS/MHz),配有8級流水線,具有雙發送、預取和分支預測功能、以及低延遲中斷系統,可以中斷多周期操作而快速進入中斷服務程式。Cortex-R4還可以與另外一個Cortex-R4構成雙核心配置,一同組成一個帶有失效檢測邏輯的備援鎖步(lock-step)配置,進而非常适合安全攸關的系統。

    Cortex-R5能夠很好的服務于網絡和資料存儲應用,它擴充了Cortex-R4的功能集,進而提高了效率和可靠性,增強了可靠實時系統中的錯誤管理。其中的一個系統功能是低延遲外設端口(LLPP),可實作快速外設讀取和寫入(而不必對整個端口進行“讀取-修改-寫入”操作)。Cortex-R5還可以實作處理器獨立運作的“鎖步(lock-step)”雙核系統,每個處理器都能通過自己的“總線接口和中斷”執行自己的程式。這種雙核實作能夠建構出非常強大和靈活的實時響應系統。

    Cortex-R7極大擴充了R系列核心的性能範圍,時脈速度可超過1GHz,性能達到3.77DMIPS/MHz。Cortex-R7上的11級流水線現在增強了錯誤管理功能,以及改進的分支預測功能。多核配置也有多種不同選項:鎖步、對稱多重處理和不對稱多重處理。Cortex-R7還配有一個完全內建的通用中斷控制器(GIC)來支援複雜的優先級中斷處理。不過,值得注意的是,雖然Cortex-R7具有高性能,但是它并不适合運作那些特性豐富的作業系統(例如Linux和Android)的應用,Cortex-A系列才更适合這類應用。

    最後,我們來讨論Cortex-M系列,特别設計針對競争已經非常激烈的MCU市場。Cortex-M系列基于ARMv7-M架構(用于Cortex-M3和Cortex-M4)建構,而較低的Cortex-M0+基于ARMv6-M架構建構。首款Cortex-M處理器于2004年釋出,當一些主流MCU供應商選擇這款核心,并開始生産MCU器件後,Cortex-M處理器迅速受到市場青睐。可以肯定的說,Cortex-M之于32位MCU就如同8051之于8位MCU——受到衆多供應商支援的工業标準核心,各家供應商采用該核心加之自己特别的開發,在市場中提供差異化産品。例如,Cortex-M系列能夠實作在FPGA中作為軟核來用,但更常見的用法是作為內建了存儲器、時鐘和外設的MCU。在該系列産品中,有些産品專注最佳能效、有些專注最高性能、而有些産品則專門應用于諸如智能電表這樣的細分市場。

    Cortex-M3和Cortex-M4是非常相似的核心。二者都具有1.25DMIPS/MHz的性能,配有3級流水線、多重32位總線接口、時鐘速率可高達200MHz,并配有非常高效的調試選項。最大的不同是,Cortex-M4的核心性能針對的是DSP。Cortex-M3和Cortex-M4具有相同的架構和指令集(Thumb-2)。然而,Cortex-M4增加了一系列特别針對處理DSP算法而優化的飽和運算和SIMD指令。以每0.5秒運作一次的512點FFT為例,如果分别在同類量産的Cortex-M3 MCU和Cortex-M4 MCU上運作,完成同樣的工作,Cortex-M3所需功耗約是Cortex-M4所需功耗的三倍。此外,也有在Cortex-M4上實作單精度浮點單元(FPU)的選項。如果應用涉及到浮點計算,那在Cortex-M4上完成比在Cortex-M3上完成要快得多。也就是說,對于不使用Cortex-M4上DSP或FPU功能的應用而言,其性能和功耗與Cortex-M3相同。換句話說,如果使用DSP功能,那就選擇Cortex-M4。否則,就選擇Cortex-M3完成工作。

    對于成本特别敏感的應用或者正在從8位遷移到32位的應用而言,Cortex-M系列的最低端産品可能是最佳選擇。雖然Cortex-M0+的性能為0.95DMIPS/MHz,比Cortex-M3和Cortex-M4的性能稍稍低一些,但仍可與同系列其他高端産品相容。Cortex-M0+采用Thumb-2指令集的子集,而且這些指令大都是16位操作數(雖然所有資料運作都是32位的),這使得它們能夠很好的适應Cortex-M0+所提供的2級流水線服務。通過減少分支映射,系統就能節約一些整體功耗,而且在大多數情況下,流水線将保留接下來的四個指令。Cortex-M0+還具有專用的總線用于單周期GPIO,這意味着你能夠利用位控制的GPIO實作确定接口,就像8位MCU那樣,但卻以32位核心的性能來處理該資料。

    Cortex-M0+的另外一個重要的不同特點是增加了微型跟蹤緩沖器(MTB)。該外設可使設計人員在調試過程中使用一些片上RAM來存儲程式分支。這些分支随後能夠回傳到內建開發環境中,而且可以重建程式流程。這一功能提供了一種初步的指令跟蹤能力,這對于不具備擴充跟蹤宏單元(ETM)功能的Cortex-M3和Cortex-M4來說比較有意義。從Cortex-M0+中提取的調試資訊等級顯著高于8位MCU,這就意味着那些難以解決的調試問題變得更加容易解決。

    綜上所述,Cortex處理器系列産品為滿足你的應用性能需求而提供了多種選項。無需勞神費力,也無論針對高端平闆電腦還是物聯網中超低成本的無線傳感器節點,你都能夠發現一款适合應用所需的處理器。

繼續閱讀