gcc編譯過程

gcc的編譯流程分為四個步驟，分别為：

· 預處理（Pre-Processing）

· 編譯（Compiling）

· 彙編（Assembling）

· 連結（Linking）

以hello.c為例子，在這四個步驟中可以設定選項分别生成hello.i, hello.s, hello.o以及最終的hello檔案：

hello.c : 最初的源代碼檔案；

hello.i : 經過編譯預處理的源代碼；

hello.s : 彙編處理後的彙編代碼；

hello.o : 編譯後的目标檔案，即含有最終編譯出的機器碼，但它裡面所引用的其他檔案中函數的記憶體位置尚未定義。

hello / a.out : 最終的可執行檔案

(還有.a(靜态庫檔案), .so(動态庫檔案), .s(彙編源檔案)留待以後讨論)

下面就具體來檢視一下gcc是如何完成四個步驟的。

hello.c源代碼

#include<stdio.h>

int main()

{

printf("Hello World!\n");

return 0;

}

（1）預處理階段

在該階段，編譯器将上述代碼中的stdio.h編譯進來，并且使用者可以使用gcc的選項”-E”進行檢視，該選項的作用是讓gcc在預處理結束後停止編譯過程。

《深入了解計算機系統》中是這麼說的：

預處理器（cpp）根據以字元#開頭的指令（directives），修改原始的C程式。如

hello.c中#include

<stdio.h>指令告訴預處理器讀系統頭檔案stdio.h的内容，并把它直接插入到程式文本中去。結果就得到另外一個C程式，通常是

以.i作為檔案擴充名的。

注意：

Gcc指令的一般格式為：Gcc [選項] 要編譯的檔案 [選項] [目标檔案]

其中，目标檔案可預設，Gcc預設生成可執行的檔案名為：編譯檔案.out

[gan@localhost gcc]# gcc –E hello.c –o hello.i

選項”-o”是指目标檔案，”.i”檔案為已經過預處理的C原始程式。以下列出了hello.i檔案的部分内容：

typedef int (*__gconv_trans_fct) (struct __gconv_step *,

struct __gconv_step_data *, void *,

__const unsigned char *,

__const unsigned char **,

__const unsigned char *, unsigned char **,

size_t *);

…

# 2 "hello.c" 2

由此可見，gcc确實進行了預處理，它把”stdio.h”的内容插入到hello.i檔案中。

（2）編譯階段

接下來進行的是編譯階段，在這個階段中，Gcc首先要檢查代碼的規範性、是否有文法錯誤等，以确定代碼的實際要做的工作，在檢查無誤後，Gcc把代

碼翻譯成彙編語言。使用者可以使用”-S”選項來進行檢視，該選項隻進行編譯而不進行彙編，生成彙編代碼。彙編語言是非常有用的，它為不同進階語言不同編譯

器提供了通用的語言。如：C編譯器和Fortran編譯器産生的輸出檔案用的都是一樣的彙編語言。

[gan@localhost gcc]# gcc –S hello.i –o hello.s

以下列出了hello.s的内容，可見Gcc已經将其轉化為彙編了，感興趣的讀者可以分析一下這一行簡單的C語言小程式是如何用彙編代碼實作的。

.file "hello.c"

.section .rodata

.align 4

.LC0:

.string "Hello World!"

.text

.globl main

.type main, @function

main:

pushl %ebp

movl %esp, %ebp

subl $8, %esp

andl $-16, %esp

movl $0, %eax

addl $15, %eax

shrl $4, %eax

sall $4, %eax

subl %eax, %esp

subl $12, %esp

pushl $.LC0

call puts

addl $16, %esp

leave

ret

.size main, .-main

.ident "GCC: (GNU) 4.0.0 20050519 (Red Hat 4.0.0-8)"

.section .note.GNU-stack,"",@progbits

（3）彙編階段

彙編階段是把編譯階段生成的”.s”檔案轉成目标檔案，讀者在此可使用選項”-c”就可看到彙編代碼已轉化為”.o”的二進制目标代碼了。如下所示：

[gan@localhost gcc]# gcc –c hello.s –o hello.o

（4）連結階段

在成功編譯之後，就進入了連結階段。在這裡涉及到一個重要的概念：函數庫。

在這個源程式中并沒有定義”printf”的函數實作，且在預編譯中包含進的”stdio.h”中也隻有該函數的聲明，而沒有定義函數的實作，那

麼，是在哪裡實作”printf”函數的呢？最後的答案是：系統把這些函數實作都被做到名為libc.so.6的庫檔案中去了，在沒有特别指定時，gcc

會到系統預設的搜尋路徑”/usr/lib”下進行查找，也就是連結到libc.so.6庫函數中去，這樣就能實作函數”printf” 了，而這也就是連結的作用。

函數庫一般分為靜态庫和動态庫兩種。靜态庫是指編譯連結時，把庫檔案的代碼全部加入到可執行檔案中，是以生成的檔案比較大，但在運作時也就不再需要庫檔案了。其字尾名一般為”.a”。動态庫與之相反，在編譯連結時并沒有把庫檔案的代碼加入到可執行檔案中，而是在程式執行時由運作時連結檔案加載庫，這樣可以節省系統的開銷。動态庫一般字尾名為”.so”，如前面所述的libc.so.6就是動态庫。gcc在編譯時預設使用動态庫。

（Linux下動态庫檔案的擴充名為".so"（Shared Object）。按照約定，所有動态庫檔案名的形式是libname.so（可能在名字中加入版本号）。這樣，線程函數庫被稱作 libthread.so。靜态庫的檔案名形式是libname.a。共享archive的檔案名形式是libname.sa。共享archive隻是一種過渡形式，幫助人們從靜态庫轉變到動态庫。）

完成了連結之後，gcc就可以生成可執行檔案，如下所示。

[gan@localhost gcc]# gcc hello.o –o hello

運作該可執行檔案，出現正确的結果如下。

[root@localhost Gcc]# ./hello

Hello World!

gcc編譯過程

繼續閱讀

OpenStack Swift源碼分析（5）----swift-ring-builder源代碼解析之二

OpenStack_Swift源碼分析——Ring的rebalance算法源代碼詳細分析1 Command類中的rebalnace方法2 Ring資料的使用

Swift源碼分析----swift-account-auditor

Swift源碼分析----swift-object-auditor(2)

Swift源碼分析----swift-object-expirer

Swift源碼分析----swift-container-updater

Swift源碼分析----swift-object-updater

Swift源碼分析----swift-container-replicator

GIS, 地理資訊系統, 軍事, 能源, 電力等地理系統, 可視化圖形中間件, VC++源代碼元件庫2018...

TF-IDF超級算法概述

Tomcat 8.x el 表達式的解析機制

三維純比例制導（源代碼）

閱讀開源引擎源代碼的方式學習遊戲引擎好嗎？

我說你牛你就牛

C#入門基礎程式設計（第一章）

ASP.NET大型績效考核評估系統源碼