天天看點

ARM中的RO、RW和ZI DATA說明(轉)

RO段、RW段和ZI段

            要了解RO,RW和ZI需要首先了解以下知識:

ARM程式的組成

            此處所說的“ARM程式”是指在ARM系統中正在執行的程式,而非儲存在ROM中的bin映像(image)檔案,這一點清注意差別。

            一個ARM程式包含3部分:RO,RW和ZI。RO是程式中的指令和常量;RW是程式中的已初始化變量;ZI是程式中的未初始化的變量.

            由以上3點說明可以了解為:RO就是readonly,RW就是read/write,ZI就是zero

ARM映像檔案的組成

            所謂ARM映像檔案就是指燒錄到ROM中的bin檔案,也稱為image檔案。以下用Image檔案來稱呼它。

            Image檔案包含了RO和RW資料。之是以Image檔案不包含ZI資料,是因為ZI資料都是0,沒必要包含,隻要程式運作之前将ZI資料所在的區域一律清零即可。包含進去反而浪費存儲空間。

            Q:為什麼Image中必須包含RO和RW?

            A:因為RO中的指令和常量以及RW中初始化過的變量是不能像ZI那樣“無中生有”的。

ARM程式的執行過程

            從以上兩點可以知道,燒錄到ROM中的image檔案與實際運作時的ARM程式之間并不是完全一樣的。是以就有必要了解ARM程式是如何從ROM中的image到達實際運作狀态的。

            實際上,RO中的指令至少應該有這樣的功能:

            1. 将RW從ROM中搬到RAM中,因為RW是變量,變量不能存在ROM中。

            2. 将ZI所在的RAM區域全部清零,因為ZI區域并不在Image中,是以需要程式根據編譯器給出的ZI位址及大小來将相應得RAM區域清零。ZI中也是變量,同理:變量不能存在ROM中

            在程式運作的最初階段,RO中的指令完成了這兩項工作後C程式才能正常通路變量。否則隻能運作不含變量的代碼。

            說了上面的可能還是有些迷糊,RO,RW和ZI到底是什麼,下面我将給出幾個例子,最直覺的來說明RO,RW,ZI在C中是什麼意思。

1、RO

            看下面兩段程式,他們之間差了一條語句,這條語句就是聲明一個字元常量。是以按照我們之前說的,他們之間應該隻會在RO資料中相差一個位元組(字元常量為1位元組)。

            Prog1:

            #include <stdio.h>

            void main(void)

            {

            ;

            }

            Prog2:

            #include <stdio.h>

            const char a = 5;

            void main(void)

            {

            ;

            }

            Prog1編譯出來後的資訊如下:

            =================================================

            Code RO Data RW Data ZI Data Debug

            948 60 0 96 0 Grand Totals

            =================================================

            Total RO Size(Code + RO Data) 1008 ( 0.98kB)

            Total RW Size(RW Data + ZI Data) 96 ( 0.09kB)

            Total ROM Size(Code + RO Data + RW Data) 1008 ( 0.98kB)

            =================================================

            Prog2編譯出來後的資訊如下:

            =================================================

            Code RO Data RW Data ZI Data Debug

            948 61 0 96 0 Grand Totals

            =================================================

            Total RO Size(Code + RO Data) 1009 ( 0.99kB)

            Total RW Size(RW Data + ZI Data) 96 ( 0.09kB)

            Total ROM Size(Code + RO Data + RW Data) 1009 ( 0.99kB)

            =================================================

            以上兩個程式編譯出來後的資訊可以看出:

            Prog1和Prog2的RO包含了Code和RO Data兩類資料。他們的唯一差別就是Prog2的RO Data比Prog1多了1個位元組。這正和之前的推測一緻。

            如果增加的是一條指令而不是一個常量,則結果應該是Code資料大小有差别。

2、RW

            同樣再看兩個程式,他們之間隻相差一個“已初始化的變量”,按照之前所講的,已初始化的變量應該是算在RW中的,是以兩個程式之間應該是RW大小有差別。

            Prog3:

            #include <stdio.h>

            void main(void)

            {

            ;

            }

            Prog4:

            #include <stdio.h>

            char a = 5;

            void main(void)

            {

            ;

            }

            Prog3編譯出來後的資訊如下:

            ==================================================

            Code RO Data RW Data ZI Data Debug

            948 60 0 96 0 Grand Totals

            ==================================================

            Total RO Size(Code + RO Data) 1008 ( 0.98kB)

            Total RW Size(RW Data + ZI Data) 96 ( 0.09kB)

            Total ROM Size(Code + RO Data + RW Data) 1008 ( 0.98kB)

            ==================================================

            Prog4編譯出來後的資訊如下: 

            ==================================================

            Code RO Data RW Data ZI Data Debug

            948 60 1 96 0 Grand Totals

            ==================================================

            Total RO Size(Code + RO Data) 1008 ( 0.98kB)

            Total RW Size(RW Data + ZI Data) 97 ( 0.09kB)

            Total ROM Size(Code + RO Data + RW Data) 1009 ( 0.99kB)

            ==================================================

            可以看出Prog3和Prog4之間确實隻有RW Data之間相差了1個位元組,這個位元組正是被初始化過的一個字元型變量“a”所引起的。

3、ZI

            再看兩個程式,他們之間的差别是一個未初始化的變量“a”,從之前的了解中,應該可以推測,這兩個程式之間應該隻有ZI大小有差别。

            Prog3:

            #include <stdio.h>

            void main(void)

            {

            ;

            }

            Prog4:

            #include <stdio.h>

            char a;

            void main(void)

            {

            ;

            }

            Prog3編譯出來後的資訊如下:

            ====================================================

            Code RO Data RW Data ZI Data Debug

            948 60 0 96 0 Grand Totals

            ====================================================

            Total RO Size(Code + RO Data) 1008 ( 0.98kB)

            Total RW Size(RW Data + ZI Data) 96 ( 0.09kB)

            Total ROM Size(Code + RO Data + RW Data) 1008 ( 0.98kB)

            ====================================================

            Prog4編譯出來後的資訊如下:

            ====================================================

            Code RO Data RW Data ZI Data Debug

            948 60 0 97 0 Grand Totals

            ====================================================

            Total RO Size(Code + RO Data) 1008 ( 0.98kB)

            Total RW Size(RW Data + ZI Data) 97 ( 0.09kB)

            Total ROM Size(Code + RO Data + RW Data) 1008 ( 0.98kB)

            ====================================================

            編譯的結果完全符合推測,隻有ZI資料相差了1個位元組。這個位元組正是未初始化的一個字元型變量“a”所引起的。

            注意:如果一個變量被初始化為0,則該變量的處理方法與未初始化華變量一樣放在ZI區域。

            即:ARM C程式中,所有的未初始化變量都會被自動初始化為0。

總結:

            1、 C中的指令以及常量被編譯後是RO類型資料。

            2、 C中的未被初始化或初始化為0的變量編譯後是ZI類型資料。

            3、 C中的已被初始化成非0值的變量編譯後市RW類型資料。

            附:

            程式的編譯指令(假定C程式名為tst.c):

            armcc -c -o tst.o tst.c

            armlink -noremove -elf -nodebug -info totals -info sizes -map -list aa.map -o tst.elf tst.o

            編譯後的資訊就在aa.map檔案中。

            ROM主要指:NAND Flash,Nor Flash

            RAM主要指:PSRAM,SDRAM,SRAM,DDRAM

------------------------------------------

Image$$??$$Limit 的含義

對于剛學習ARM的人來說,如果分析它的啟動代碼,往往不明白下面幾個變量的含義:|Image$$RO$$Limit|、|Image$$RW$$Base|、|Image$$ZI$$Base|。

首先申明我使用的調試軟體為ADS1.2,當我們把程式編寫好以後,就要進行編譯和連結了,在ADS1.2中選擇MAKE按鈕,會出現一個Errors and Warnings 的對話框,在該欄中顯示編譯和連結的結果,如果沒有錯誤,在檔案的最後應該能看到Image component sizes,後面緊跟的依次是Code,RO Data ,RW Data ,ZI Data ,Debug 各個項目的位元組數,最後會有他們的一個統計資料:

Code 163632 ,RO Data 20939 ,RW Data 53 ,ZI Data 17028

Tatal RO size (Code+ RO Data)             184571 (180.25kB)

Tatal RW size(RW Data+ ZI Data)           17081(16.68 kB)

Tatal ROM size(Code+ RO Data+ RW Data)   184624(180.30 kB)

後面的位元組數是根據使用者不同的程式而來的,下面就以上面的資料為例來介紹那幾個變量的計算。

在ADS的Debug Settings中有一欄是Linker/ARM Linker,在output選項中有一個RO base選項,下面應該有一個位址,我這裡是0x0c100000,後面的RW base 位址是0x0c200000,然後在Options選項中有Image entry point ,是一個初始程式的入口位址,我這裡是0x0c100000 。

有了上面這些資訊我們就可以完全知道這幾個變量是怎麼來的了:

|Image$$RO$$Base| = Image entry point = 0x0c100000 ;表示程式代碼存放的起始位址

|Image$$RO$$Limit|=程式代碼起始位址+代碼長度+1=0x0c100000+Tatal RO size+1

= 0x0c100000 + 184571 + 1 = 0x0c100000 +0x2D0FB + 1

= 0x0c12d0fc

|Image$$RW$$Base| = 0x0c200000 ;由RW base 位址指定

|Image$$RW$$Limit| =|Image$$RW$$Base|+ RW Data 53 = 0x0c200000+0x37(4的倍數,0到55,共56個單元)=0x0c200037

|Image$$ZI$$Base| = |Image$$RW$$Limit| + 1 =0x0c200038

|Image$$ZI$$Limit| = |Image$$ZI$$Base| + ZI Data 17028

                            =0x0c200038 + 0x4284

                            =0x0c2042bc

也可以由此計算:

|Image$$ZI$$Limit| = |Image$$RW$$Base| +TatalRWsize(RWData+ZIData) 17081

                            =0x0c200000+0x42b9+3(要滿足4的倍數)

                            =0x0c2042bc

加點自己的補充:

RO 是code + RO Data ,RO data應該是const聲明的常量

下載下傳到固件中的代碼包括RO和RW,ZI主要被malloc 函數用到,還有這些概念和堆棧的聯系,malloc聲明的變量在heap(堆)中,stack(棧)是用來存放臨時變量的。

-----------------------------------------------------

一般而言,一個程式包括隻讀的代碼段和可讀寫的資料段。在ARM的內建開發環境中,隻讀的代碼段和常量被稱作RO段(ReadOnly);可讀寫的全局變量和靜态變量被稱作RW段(ReadWrite);RW段中要被初始化為零的變量被稱為ZI段(ZeroInit)。對于嵌入式系統而言,程式映象都是存儲在Flash存儲器等一些非易失性器件中的,而在運作時,程式中的RW段必須重新裝載到可讀寫的RAM中。這就涉及到程式的加載時域和運作時域。簡單來說,程式的加載時域就是指程式燒入Flash中的狀态,運作時域是指程式執行時的狀态。對于比較簡單的情況,可以在ADS內建開發環境的ARM LINKER選項中指定RO BASE和RW BASE,告知連接配接器RO和RW的連接配接基位址。對于複雜情況,如RO段被分成幾部分并映射到存儲空間的多個地方時,需要建立一個稱為“分布裝載描述檔案”的文本檔案,通知連接配接器把程式的某一部分連接配接在存儲器的某個位址空間。需要指出的是,分布裝載描述檔案中的定義要按照系統重定向後的存儲器分布情況進行。在引導程式完成初始化的任務後,應該把主程式轉移到RAM中去運作,以加快系統的運作速度。

            什麼是arm的映像檔案,arm映像檔案其實就是可執行檔案,包括bin或hex兩種格式,可以直接燒到rom裡執行。在axd調試過程中,我們調試的是axf檔案,其實這也是一種映像檔案,它隻是在bin檔案中加了一個檔案頭和一些調試資訊。映像檔案一般由域組成,域最多由三個輸出段組成(RO,RW,ZI)組成,輸出段又由輸入段組成。所謂域,指的就是整個bin映像檔案所處在的區域,它又分為加載域和運作域。加載域就是映像檔案被靜态存放的工作區域,一般來說flash裡的 整個bin檔案所在的位址空間就是加載域,當然在程式一般都不會放在 flash裡執行,一般都會搬到sdram裡運作工作,它們在被搬到sdram裡工作所處的位址空間就是運作域。

        我們輸入的代碼,一般有代碼部分和資料部分,這就是所謂的輸入段,經過編譯後就變成了bin檔案中ro段和rw段,還有所謂的zi段,這就是輸出段。對于加載域中的輸出段,一般來說ro段後面緊跟着rw段,rw段後面緊跟着zi段。在運作域中這些輸出段并不連續,但rw和zi一定是連着的。zi段和rw段中的資料其實可以是rw屬性。 

                | Image$$RO$$Base| |Image$$RO$$Limit| |Image$$RW$$Base| |Image$$ZI$$Base| |Image$$ZI$$Limit|這幾個變量是編譯器通知的,我們在 makefile檔案中可以看到它們的值。它們訓示了在運作域中各個輸出段所處的位址空間。| Image$$RO$$Base| 就是ro段在運作域中的起始位址,|Image$$RO$$Limit| 是ro段在運作域中的截止位址。其它依次類推。我們可以在linker的output中指定,在 simple模式中,ro base對應的就是| Image$$RO$$Base|,rw base 對應的是|Image$$RW$$Base|,由于rw和zi相連,|Image$$ZI$$Base| 就等于|Image$$ZI$$limit| .其它的值都是編譯器自動計算出來的。

            下面是2410啟動代碼的搬運部分,我給出注釋

            BaseOfROM DCD |Image$$RO$$Base|

            TopOfROM DCD |Image$$RO$$Limit|

            BaseOfBSS DCD |Image$$RW$$Base|

            BaseOfZero DCD |Image$$ZI$$Base|

            EndOfBSS DCD |Image$$ZI$$Limit|

            adr r0, ResetEntry;    ResetEntry是複位運作時域的起始位址,在boot nand中一般是0

            ldr r2, BaseOfROM;

            cmp r0, r2

            ldreq r0, TopOfROM;TopOfROM=0x30001de0,代碼段位址的結束

            beq InitRam 

            ldr r3, TopOfROM

            ;part 1,通過比較,将ro搬到sdram裡,搬到的目的位址從 | Image$$RO$$Base| 開始,到|Image$$RO$$Limit|結束

            ldmia r0!, {r4-r7}

            stmia r2!, {r4-r7}

            cmp r2, r3

            bcc %B0;

            ;part 2,搬rw段到sdram,目的位址從|Image$$RW$$Base| 開始,到|Image$$ZI$$Base|結束

            sub r2, r2, r3;r2=0

            sub r0, r0, r2    

            InitRam ;carry rw to baseofBSS

            ldr r2, BaseOfBSS ;TopOfROM=0x30001de0,baseofrw

            ldr r3, BaseOfZero ;BaseOfZero=0x30001de0

            cmp r2, r3

            ldrcc r1, [r0], #4

            strcc r1, [r2], #4

            bcc %B0 

            ;part 3,将sdram zi初始化為0,位址從|Image$$ZI$$Base|到|Image$$ZI$$Limit|

            mov r0, #0;init 0

            ldr r3, EndOfBSS;EndOfBSS=30001e40

            1 

            cmp r2, r3

            strcc r0, [r2], #4

            bcc %B1

------------------------------------------------------------

一 概述

Scatter file (分散加載描述檔案)用于armlink的輸入參數,他指定映像檔案内部各區域的download與運作時位置。Armlink将會根據scatter file生成一些區域相關的符号,他們是全局的供使用者建立運作時環境時使用。(注意:當使用了scatter file 時将不會生成以下符号 Image$$RW$$Base, Image$$RW$$Limit, Image$$RO$$Base, Image$$RO$$Limit, Image$$ZI$$Base, and Image$$ZI$$Limit)

二 什麼時候使用scatter file

       當然首要的條件是你在利用ADS進行項目開發,下面我們看看更具體的一些情況。

1 存在複雜的位址映射:例如代碼和資料需要分開放在在多個區域。

2 存在多種存儲器類型:例如包含 Flash,ROM,SDRAM,快速SRAM。我們根據代碼與資料的特性把他們放在不同的存儲器中,比如中斷處理部分放在快速SRAM内部來提高響應速度,而把不常用到的代碼放到速度比較慢的Flash内。

3 函數的位址固定定位:可以利用Scatter file實作把某個函數放在固定位址,而不管其應用程式是否已經改變或重新編譯。

4 利用符号确定堆與堆棧:

5 記憶體映射的IO:采用scatter file可以實作把某個資料段放在精确的地指處。

是以對于嵌入式系統來說scatter file是必不可少的,因為嵌入式系統采用了ROM,RAM,和記憶體映射的IO。

樓主的文章很好,我的實踐驗證了其正确性:

一、const關鍵字的影響

     一個外部變量加不加const來修飾,有很大差別,正如樓主所言,加const編譯後是RO-data,不加,編譯後是RW-data,都是image的組成部分,即都占用了flash空間(程式存儲器空間),但是,RO-data不占用RAM,RW-data卻占用RAM。

      在RAM較小,外部變量較大的情況下,有緻命差別:

       現在 memory layout為on-chip flash 500KB,on-chip RAM為64KB

       我有一個圖檔資料為:

       unsigned char gImage_bmp[362*272*2]={0x63,0x34,..........};  共計90KB左右;

       如果,用const修飾,程式可正确編譯運作。說明RO-data沒有複制到RAM中;沒有占用RAM空間

       如果,不用const修飾,編譯後為RW-data,連接配接出錯,提示RAM不夠,可見RW-data不光占用flash,還占用RAM。

       幸運的是我的闆子上外擴了32M的SDRAM,起始位址0xa000 0000,大小0x200 0000

現在将memory layout改為

      on-chip flash 500KB,on-chip RAM 64KB,off-chip RAM start 0xa000 0000  size 0x100 0000

即加了16MB的SDRAM作為分散加載的RAM空間,這樣,在沒有const修飾時,仍能編譯連接配接正确,運作正确。

      可見,這個差别是很大的!

二、ZI-data

     我在main.c中定義了一個外部變量:

     __align(8) unsigned short frame_buf_0[480*272];

    編譯後顯示為ZI-data,ZI,我的了解,可以說不用初始化,或者預設用0初始化,程式需要設定外部SDRAM作為分散加載的RAM空間,否則,連接配接時提示,RAM空間不夠。