gcc連接配接腳本lds詳解

我們對每個c或者彙編檔案進行單獨編譯，但是不去連接配接，生成很多.o 的檔案，這些.o檔案首先是分散的，我們首先要考慮的如何組合起來；其次，這些.o檔案存在互相調用的關系；再者，我們最後生成的bin檔案是要在硬體中運作的，每一部分放在什麼位址都要有仔細的說明。我覺得在寫makefile的時候，最為重要的就是ld的了解，下面說說我的經驗：

首先，要确定我們的程式用沒有用到标準的c庫，或者一些系統的庫檔案，這些一般是在作業系統之上開發要注意的問題，這裡并不多說，熟悉在Linux程式設計的人，基本上都會用ld指令；這裡，我們從頭開始,直接進行彙編語言的連接配接。

我們寫一個彙程式設計式，控制GPIO，進而控制外接的LED，代碼如下;

.text

.global _start

_start:

LDR

R0,=0x56000010 @GPBCON寄存器

MOV R1,# 0x00000400

str R1,[R0]

LDR R0,=0x56000014

MOV R1,#0x00000000

STR R1,[R0]

MAIN_LOOP:

B MAIN_LOOP

代碼很簡單，就是一個對io口進行設定然後寫資料。我們看它是如何編譯的，注意我們這裡使用的不是arm-linux-gcc而是arm-elf-gcc，二者之間沒有什麼比較大的差別，arm-linux-gcc可能包含更多的庫檔案，在指令行的編譯上面是沒有差別。我們來看是如何編譯的：

arm-elf-gcc -g -c -o led_On.o led_On.s 首先純編譯不連接配接

arm-elf-ld -Ttext 0x00000000 -g led_On.o -o led_on_elf

用Ttext指明我們程式存儲的地方，這裡生成的是elf檔案，還不是我們真正的bin，但是可以借助一些工具可以進行調試。然後：

arm-elf-objcopy -O binary -S led_on_elf led_on.bin

生成bin檔案。

-T選項是ld指令中比較重要的一個選項，可以用它直接指明代碼的代碼段、資料段、bss段，對于複雜的連接配接，可以專門寫一個腳本來告訴編譯器如何連接配接。

-Ttext addr

-Tdata addr

-Tbss addr

arm-elf-ld -Ttext

0x00000000 -g led_On.o -o led_on_elf ，運作位址為0x00000000，由于沒有指明資料段和bss，他們會預設的依次放在後面。相同的代碼不同的Ttext，你可以對比一下他們之間會變的差異，ld會自動調整跳轉的位址。

第二個概念：section，section可以了解成一塊，例如像c裡面的一個子函數，就是一個section，連結器ld把object檔案中的每個section都作為一個整體，為其配置設定運作的位址(memory layout)，這個過程就是重定位(relocation)；最後把所有目标檔案合并為一個目标檔案。

連結通過一個linker

script來控制，這個腳本描述了輸入檔案的sections到輸出檔案的映射，以及輸出檔案的memory layout。

是以，linker總會使用一個linker script，如果不特别指定，則使用預設的script；可以使用‘-T’指令行選項來指定一個linker script。

＊映像檔案的輸入段與輸出段

linker把多個輸入檔案合并為一個輸出檔案。輸出檔案和輸入檔案都是目标檔案(object

file)，輸出檔案通常被稱為可執行檔案(executable)。

每個目标檔案都有一系列section，輸入檔案的section稱為input section，輸出檔案的section則稱為output section。

一個section可以是loadable的，即輸出檔案運作時需要将這樣的section加載到memory(類似于RO&RW段)；也可以是 allocatable的，這樣的section沒有任何内容，某些時候用0對相應的memory區域進行初始化(類似于ZI段)；如果一個 section既非loadable也非allocatable，則它通常包含的是調試資訊。

每個loadable或 allocatable的output

section都有兩個位址，一是VMA(virtual

memory address)，是該section的運作時域位址；二是LMA(load memory address)，是該section的加載時域位址。

可以通過objdump工具附加'-h'選項來檢視目标檔案中的sections。

＊簡單的Linker script

(1) SECTIONS指令：

The SECTIONS command tells the

linker how to map input sections into output sections,

and how to place the output sections in memory.

指令格式如下：

SECTIONS

{

sections-command

......

}

其中sections-command可以是ENTRY指令，符号指派，輸出段描述，也可以是overlay描述。

(2)位址計數器‘.’(location counter)：

該符号隻能用于SECTIONS指令内部，初始值為‘0’，可以對該符号進行指派，也可以使用該符号進行計算或指派給其他符号。它會自動根據SECTIONS指令内部所描述的輸出段的大小來計算目前的位址。

(3) 輸出段描述(output section description)：

前面提到在SECTIONS指令中可以作輸出段描述，描述的格式如下：

section [address] [(type)] : [AT(lma)]

output-section-command

...

} [>region] [AT>lma_region]

[:phdr :phdr ...] [=fillexp]

很多附加選項是用不到的。其中的output-section-command又可以是符号指派，輸入段描述，要直接包含的資料值，或者某一特定的輸出段關鍵字。

＊linker script 執行個體

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝

OUTPUT_ARCH(arm)

ENTRY(_start)

SECTIONS {

. = 0xa3f00000;

__boot_start =

.start ALIGN(4)

: {

*(.text.start)

}

.setup

ALIGN(4) : {

setup_block = .;

*(.setup)

setup_block_end = .;

.text

*(.text)

.rodata

*(.rodata)

.data ALIGN(4)

*(.data)

.got

*(.got)

__boot_end = .;

.bss

ALIGN(16) : {

bss_start = .;

*(.bss)

*(COMMON)

bss_end = .;

.comment

*(.comment)

stack_point =

__boot_start + 0x00100000;

loader_size =

__boot_end - __boot_start;

setup_size =

setup_block_end - setup_block;

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝

在SECTIONS指令中的類似于下面的描述結構就是輸出段描述：

.start ALIGN(4) : {

*(.text.start)

.start 為output section name，ALIGN(4)傳回一個基于location counter(.)的4位元組對齊的位址值。*(.text.start)是輸入段描述，*為通配符，意思是把所有被連結的object檔案中的.text.start段都連結進這個名為.start的輸出段。

源檔案中所辨別的section及其屬性實際上就是對輸入段的描述，例如.text.start輸入段在源檔案start.S中的代碼如下：

.section .text.start

_start :

b start

arm-elf-ld -Ttimer.lds -o

timer_elf header .o

這裡就必須存在一個timer.lds的檔案。

對于.lds檔案，它定義了整個程式編譯之後的連接配接過程，決定了一個可執行程式的各個段的存儲位置。雖然現在我還沒怎麼用它，但感覺還是挺重要的，有必要了解一下。

先看一下GNU官方網站上對.lds檔案形式的完整描述：

...

secname start BLOCK(align) (NOLOAD) : AT ( ldadr )

{ contents } >region :phdr =fill

}

secname和contents是必須的，其他的都是可選的。下面挑幾個常用的看看：

1、secname：段名

2、contents：決定哪些内容放在本段，可以是整個目标檔案，也可以是目标檔案中的某段（代碼段、資料段等）

3、start：本段連接配接（運作）的位址，如果沒有使用AT（ldadr），本段存儲的位址也是start。GNU網站上說start可以用任意一種描述位址的符号來描述。

4、AT（ldadr）：定義本段存儲（加載）的位址。

/* nand.lds */

SECTIONS {

firtst 0x00000000 : { head.o init.o }

second 0x30000000 : AT(4096) { main.o }

以上，head.o放在0x00000000位址開始處，init.o放在head.o後面，他們的運作位址也是0x00000000，即連接配接和存儲位址相同（沒有AT指定）；main.o放在4096（0x1000，是AT指定的，存儲位址）開始處，但是它的運作位址在0x30000000，運作之前需要從0x1000（加載處）複制到0x30000000（運作處），此過程也就用到了讀取Nand flash。

這就是存儲位址和連接配接（運作）位址的不同，稱為加載時域和運作時域，可以在.lds連接配接腳本檔案中分别指定。

編寫好的.lds檔案，在用arm-linux-ld連接配接指令時帶-Tfilename來調用執行，如

arm-linux-ld –Tnand.lds x.o y.o –o xy.o。也用-Ttext參數直接指定連接配接位址，如

arm-linux-ld –Ttext 0x30000000 x.o y.o –o xy.o。

既然程式有了兩種位址，就涉及到一些跳轉指令的差別，這裡正好寫下來，以後萬一忘記了也可檢視，以前不少東西沒記下來現在忘得差不多了。

ARM彙編中，常有兩種跳轉方法：b跳轉指令、ldr指令向PC指派。

我自己經過歸納如下：

b step1 ：b跳轉指令是相對跳轉，依賴目前PC的值，偏移量是通過該指令本身的bit[23:0]算出來的，這使得使用b指令的程式不依賴于要跳到的代碼的位置，隻看指令本身。

ldr pc, =step1 ：該指令是從記憶體中的某個位置（step1）讀出資料并賦給PC，同樣依賴目前PC的值，但是偏移量是那個位置（step1）的連接配接位址（運作時的位址），是以可以用它實作從Flash到RAM的程式跳轉。

此外，有必要回味一下adr僞指令，U-boot中那段relocate代碼就是通過adr實作目前程式是在RAM中還是flash中。仍然用我當時的注釋

adr r0, _start /* r0是代碼的目前位置 */

/* adr僞指令，彙編器自動通過目前PC的值算出如果執行到_start時PC的值，放到r0中：

當此段在flash中執行時r0 = _start = 0；當此段在RAM中執行時_start = _TEXT_BASE(在board/smdk2410/config.mk中指定的值為0x33F80000，即u-boot在把代碼拷貝到RAM中去執行的代碼段的開始) */

ldr r1, _TEXT_BASE /* 測試判斷是從Flash啟動，還是RAM */

/* 此句執行的結果r1始終是0x33FF80000，因為此值是又編譯器指定的(ads中設定，或-D設定編譯器參數)

cmp r0, r1 /* 比較r0和r1，調試的時候不要執行重定位 */

下面，結合u-boot.lds看看一個正式的連接配接腳本檔案。這個檔案的基本功能還能看明白，雖然上面分析了好多，但其中那些GNU風格的符号還是着實讓我感到迷惑。

OUTPUT_FORMAT("elf32littlearm",

"elf32littlearm", "elf32littlearm")

;指定輸出可執行檔案是elf格式,32位ARM指令,小端

OUTPUT_ARCH(arm)

;指定輸出可執行檔案的平台為ARM

ENTRY(_start)

;指定輸出可執行檔案的起始代碼段為_start.

SECTIONS

{

. = 0x00000000 ; 從0x0位置開始

. = ALIGN(4) ; 代碼以4位元組對齊

.text : ;指定代碼段

{

cpu/arm920t/start.o

(.text) ; 代碼的第一個代碼部分

*(.text) ;其它代碼部分

}

. = ALIGN(4)

.rodata : { *(.rodata) } ;指定隻讀資料段

. = ALIGN(4);

.data : { *(.data) } ;指定讀/寫資料段

.got : { *(.got) } ;指定got段, got段式是uboot自定義的一個段, 非标準段

__u_boot_cmd_start = . ;把__u_boot_cmd_start指派為目前位置, 即起始位置

.u_boot_cmd : { *(.u_boot_cmd) } ;指定u_boot_cmd段, uboot把所有的uboot指令放在該段.

__u_boot_cmd_end = .;把__u_boot_cmd_end指派為目前位置,即結束位置

__bss_start = .; 把__bss_start指派為目前位置,即bss段的開始位置

.bss : { *(.bss) }; 指定bss段

_end = .; 把_end指派為目前位置,即bss段的結束位置

gcc連接配接腳本lds詳解

繼續閱讀

Apache (You don't have permission to access / on this server.）

debian9更新4.9.0核心到4.19.2核心過程

centOS7 配置 vsftpd 虛拟使用者及權限Vsftpd配置虛拟使用者及權限

linux-svn解除安裝與安裝

vsftp虛拟多使用者多權限一鍵部署腳本

Ubuntu14.04 LTS下安裝mongodb

httpd服務的部署、啟動、配置和簡單優化一、部署二、啟動三、配置檔案

配置網頁内容通路

手動安裝Intel network I217-LM網卡的Linux驅動

禁止ubuntu系統彈出報錯界面

Ubuntu Linux下Apache的配置檔案

samba伺服器的功能

【Linux】UDP廣播封包接收速率問題

Linux裝置模型（中）之上層容器

PowerPC平台 Linux移植三