天天看點

痞子衡嵌入式:MCUXpresso IDE下設定代碼編譯優化等級的幾種方法

  大家好,我是痞子衡,是正經搞技術的痞子。今天痞子衡給大家分享的是MCUXpresso IDE下設定代碼編譯優化等級的幾種方法。

  最近公司晶片設計團隊正在開發一款全新的基于 Cortex-M33 核心的晶片,為了保證晶片性能達标,驗證團隊将 coremark 基準測試程式也當作了一個測試用例,而在 RTL 環境裡指定的 C 編譯器是标準 GCC,驗證團隊發現跑出來的 coremark 程式測試結果與 Arm 給的 Cortex-M33 參考值 4.02 CoreMark/MHz 有一定差距,痞子衡參與了這個問題調查。

  在 Arm Cortex-M33 官方首頁,其備注了 4.02 CoreMark/MHz 參考值來自于 EEMBC 官網上的一款 恩智浦 LPC55S69JBD100 晶片跑出來的結果,頁面裡備注了跑分結果是在 Arm Clang Compiler v6.12 下開啟最高優化等級 -Omax 下得到的,而驗證團隊用得是 GCC,痞子衡斷定問題大機率是由不同編譯器優化性能差異引起的,借着這個實際問題,今天痞子衡跟大家聊一聊 MCUXpresso IDE 下編譯優化等級設定方法。

  • Note:本文使用的 MCUXpresso IDE 軟體版本是 v11.6.0_8187。

一、檢視MCUX下GCC版本

  有朋友可能會覺得奇怪,文章開頭裡明明聊得是 GCC 下 coremark 跑分問題,為何痞子衡引出了 MCUXpresso IDE?其實 MCUXpresso IDE 是恩智浦推出的免費內建開發環境,其底層編譯器就是标準 GCC 工具鍊,使用 MCUXpresso IDE,我們就不用像使用 GCC 那樣手動準備相應 Makefile 去做編譯了。

  因為我們是借助 MCUXpresso IDE 來測試 GCC 編譯優化性能,是以需要了解目前 GCC 版本,可以在 MCUXpresso IDE 安裝目錄如下路徑下找到 GCC 版本資訊。執行 arm-none-eabi-gcc.exe -v 指令即可知道其版本,MCUXpresso IDE v11.6 使用得是 GCC v10.3.1。

\MCUXpressoIDE_11.6.0_8187\ide\tools\bin\arm-none-eabi-gcc.exe
\MCUXpressoIDE_11.6.0_8187\ide\tools\lib\gcc\arm-none-eabi\10.3.1
           

二、GCC支援的優化等級

  既然咱們聊得是優化等級設定方法,首先我們得知道 GCC 下支援哪些優化等級,我們可以在 MCUXpresso IDE 安裝目錄或者 GCC 官網找到使用者手冊(gcc.pdf),手冊裡面 Section 3.11 Options that Control Optimization 章節有詳細的解釋。

\MCUXpressoIDE_11.6.0_8187\ide\tools\share\doc\gcc-arm-none-eabi\pdf\gcc.pdf
https://gcc.gnu.org/onlinedocs/gcc-10.3.0/gcc.pdf
           

  GCC 本身支援非常多的優化政策小項,大概有如下 100 多個,可以在手冊裡去看每個小項的具體解釋,了解了這些小項,我們在編譯時當然可以把這些政策參數按需加上去,不過這種方式顯然比較繁瑣。

痞子衡嵌入式:MCUXpresso IDE下設定代碼編譯優化等級的幾種方法

  GCC 為了化繁為簡,将這些政策小項做了分類整理,形成了如下 8 個等級(基于代碼大小和運作速度兩個方向逐漸加檔),我們在實際編譯時一般直接用這 8 個優化等級即可。

優化等級 政策解釋
-O0 不進行任何優化(如果沒有指定優化級别,即為此預設設定)。
-O或者-O1

在不影響編譯速度的前提下,盡量采用一些優化算法降低代碼大小和提高可執行代碼的運作速度。

-此等級執行了 45 個政策小項。

-O2

犧牲部分編譯速度,采用幾乎所有的目标配置支援的優化算法,用以提高目标代碼的運作速度。

-此等級在-O1所有優化政策小項之上增加了 48 個政策小項。

-O3

采取很多向量化算法,提高代碼的并行執行程度,比如利用現代CPU中的流水線,Cache等,目标是甯願增加目标代碼的大小,也要拼命的提高運作速度。

-此等級在-O2所有優化政策小項之上增加了 16 個政策小項。

-Os

與-O3有異曲同工之妙,但兩者的目标不一樣,這個等級是為了盡量的降低目标代碼的大小,這對于存儲容量很小的裝置來說非常重要。

-此等級在-O2所有優化政策小項之上減掉了 6 個政策小項,然後使能了 -finline-functions 政策。

-Ofast

不會嚴格遵循語言标準,會針對某些語言啟用部分優化,以達到最快的運作速度。

-此等級在-O3所有優化政策小項之上增加了 -ffast-math 和 -fallow-store-data-races 政策。

-Og 在保持快速編譯和良好調試體驗的同時,提供合理的優化級别。
-Oz 比-Os更激進的去降低目标代碼的大小,GCC v12.x 之後的版本才引入。

三、MCUX下設定優化等級的三種方法

  在 MCUXpresso IDE 工程裡,我們有三種方法來設定優化等級,分别針對單個函數、單個源檔案、整個工程源檔案。

3.1 在源檔案中設定

  第一種優化等級設定方法主要針對單個函數,即使用 __attribute__ 來修飾函數(這其實是 GCC 下通用做法,與 MCUX 關系不大),經過修飾的函數可以不受 MCUXpresso IDE 工程整體優化等級設定影響。

void __attribute__((optimize("O3"))) function(void)
{
    ...
}
           

  第二種優化等級設定方法主要針對多個相鄰函數或者整個源檔案,即使用如下 #pragma 組合語句來修飾代碼(這也是 GCC 下通用做法,與 MCUX 關系不大),經過修飾的代碼也同樣不受 MCUXpresso IDE 工程整體優化等級設定影響。

#pragma GCC push_options     // 代碼作用範圍起始處
#pragma GCC optimize("O3")   // 代碼優化等級設定
void function1(void)
{
    ...
}
void function2(void)
{
    ...
}
...
#pragma GCC pop_options      // 代碼作用範圍結尾處
           

3.2 在IDE選項中設定

  第三種優化等級設定方法主要針對工程全部源檔案,即在 MCUXpresso IDE 工程選項裡 Optimization Level 一欄項目裡做切換選擇,這裡基本上與 GCC v10.3 優化等級定義是一緻的,但是缺少了 -Ofast 選項。

痞子衡嵌入式:MCUXpresso IDE下設定代碼編譯優化等級的幾種方法

四、MCUX下設定-Ofast等級

  痞子衡找了一塊 MIMXRT595-EVK 開發闆(主晶片為 Cortex-M33 核心),在其配套 SDK 裡的 hello world 工程基礎之上移植了 coremark 程式,在 IAR v9.10 最高優化等級下(High-Speed, No size constraints)得到了 3.94 CoreMark/MHz 的跑分,這很接近 Arm 基準值,但是在 MCUXpresso IDE 最高優化等級下(-O3)僅得到了 2.76 CoreMark/MHz。

  莫非是必須要在 MCUXpresso IDE 下開啟 GCC 的最快運作優化等級 -Ofast 才能得到理想 coremark 跑分,但是 MCUXpresso IDE 選項裡并沒有 -Ofast 怎麼辦?别着急,剛才工程選項下還有 Other optimization flags 後門,我們在這裡手動添加上 -Ofast 比 -O3 多的那兩個優化政策小項,以及 MCUX 團隊要求的 -fno-semantic-interposition 小項,這樣基本就等于 - Ofast 效果。

-ffast-math -fallow-store-data-races -fno-semantic-interposition
           
痞子衡嵌入式:MCUXpresso IDE下設定代碼編譯優化等級的幾種方法

  重新編譯,再跑一次 -Ofast 等級下的 MCUXpresso IDE 工程,發現 coremark 跑分結果并沒有比 -O3 等級下有多大提升,想了想雖然跑不到 IAR 上 3.94 CoreMark/MHz 的高分有點不甘心,但是這也很正常嘛,免費的 GCC 編譯器如果能達到商業 IAR 編譯器那樣的效果,那人家商業編譯器還怎麼收費呢,了解萬歲!

  至此,MCUXpresso IDE下設定代碼編譯優化等級的幾種方法痞子衡便介紹完畢了,掌聲在哪裡~~~

歡迎訂閱

文章會同時釋出到我的 部落格園首頁、CSDN首頁、知乎首頁、微信公衆号 平台上。

微信搜尋"痞子衡嵌入式"或者掃描下面二維碼,就可以在手機上第一時間看了哦。

  最後歡迎關注痞子衡個人微信公衆号【痞子衡嵌入式】,一個專注嵌入式技術的公衆号,跟着痞子衡一起玩轉嵌入式。

  衡傑(痞子衡),目前就職于恩智浦MCU系統部門,擔任嵌入式系統應用工程師。

  專欄内所有文章的轉載請注明出處:http://www.cnblogs.com/henjay724/

  與痞子衡進一步交流或咨詢業務合作請發郵件至 [email protected]

  可以關注痞子衡的Github首頁 https://github.com/JayHeng,有很多好玩的嵌入式項目。

  關于專欄文章有任何疑問請直接在部落格下面留言,痞子衡會及時回複免費(劃重點)答疑。

  痞子衡郵箱已被私信擠爆,技術問題不推薦私信,堅持私信請先掃碼付款(5元起步)再發。