C語言位元組對齊

文章最後本人做了一幅圖，一看就明白了，這個問題網上講的不少，但是都沒有把問題說透。

　　一、概念

　　對齊跟資料在記憶體中的位置有關。如果一個變量的記憶體位址正好位于它長度的整數倍，他就被稱做自然對齊。比如在32位cpu下，假設一個整型變量的位址為0x00000004，那它就是自然對齊的。

　　二、為什麼要位元組對齊

　　需要位元組對齊的根本原因在于CPU通路資料的效率問題。假設上面整型變量的位址不是自然對齊，比如為0x00000002，則CPU如果取它的值的話需要通路兩次記憶體，第一次取從0x00000002-0x00000003的一個short，第二次取從0x00000004-0x00000005的一個short然後組合得到所要的資料，如果變量在0x00000003位址上的話則要通路三次記憶體，第一次為char，第二次為short，第三次為char，然後組合得到整型資料。而如果變量在自然對齊位置上，則隻要一次就可以取出資料。一些系統對對齊要求非常嚴格，比如sparc系統，如果取未對齊的資料會發生錯誤，舉個例：

　　char ch[8];

　　char *p = &ch[1];

　　int i = *(int *)p;

　　運作時會報segment error，而在x86上就不會出現錯誤，隻是效率下降。

　　三、正确處理位元組對齊

　　對于标準資料類型，它的位址隻要是它的長度的整數倍就行了，而非标準資料類型按下面的原則對齊：

　　數組：按照基本資料類型對齊，第一個對齊了後面的自然也就對齊了。

　　聯合：按其包含的長度最大的資料類型對齊。

　　結構體：結構體中每個資料類型都要對齊。

　　比如有如下一個結構體：

　　struct stu{

　　 char sex;

　　 int length;

　　 char name[10];

　　};

　　struct stu my_stu;

　　由于在x86下，GCC預設按4位元組對齊，它會在sex後面跟name後面分别填充三個和兩個位元組使length和整個結構體對齊。于是我們sizeof(my_stu)會得到長度為20，而不是15.

　　四、__attribute__選項

　　我們可以按照自己設定的對齊大小來編譯程式，GNU使用__attribute__選項來設定，比如我們想讓剛才的結構按一位元組對齊，我們可以這樣定義結構體

　　}__attribute__ ((aligned (1)));

　　則sizeof(my_stu)可以得到大小為15。

　　上面的定義等同于

　　}__attribute__ ((packed));

　　__attribute__((packed))得變量或者結構體成員使用最小的對齊方式，即對變量是一位元組對齊，對域（field）是位對齊.

　　五、什麼時候需要設定對齊

　　在設計不同CPU下的通信協定時，或者編寫硬體驅動程式時寄存器的結構這兩個地方都需要按一位元組對齊。即使看起來本來就自然對齊的也要使其對齊，以免不同的編譯器生成的代碼不一樣.

一、快速了解

1. 什麼是位元組對齊？

在C語言中，結構是一種複合資料類型，其構成元素既可以是基本資料類型（如int、long、float等）的變量，也可以是一些複合資料類型（如數組、結構、聯合等）的資料單元。在結構中，編譯器為結構的每個成員按其自然邊界（alignment）配置設定空間。各個成員按照它們被聲明的順序在記憶體中順序存儲，第一個成員的位址和整個結構的位址相同。

為了使CPU能夠對變量進行快速的通路,變量的起始位址應該具有某些特性,即所謂的”對齊”. 比如4位元組的int型,其起始位址應該位于4位元組的邊界上,即起始位址能夠被4整除.

2. 位元組對齊有什麼作用？

位元組對齊的作用不僅是便于cpu快速通路，同時合理的利用位元組對齊可以有效地節省存儲空間。

對于32位機來說，4位元組對齊能夠使cpu通路速度提高，比如說一個long類型的變量，如果跨越了4位元組邊界存儲，那麼cpu要讀取兩次，這樣效率就低了。但是在32位機中使用1位元組或者2位元組對齊，反而會使變量通路速度降低。是以這要考慮處理器類型，另外還得考慮編譯器的類型。在vc中預設是4位元組對齊的，GNU gcc 也是預設4位元組對齊。

3. 更改C編譯器的預設位元組對齊方式

在預設情況下，C編譯器為每一個變量或是資料單元按其自然對界條件配置設定空間。一般地，可以通過下面的方法來改變預設的對界條件：

· 使用僞指令#pragma pack (n)，C編譯器将按照n個位元組對齊。

· 使用僞指令#pragma pack ()，取消自定義位元組對齊方式。

另外，還有如下的一種方式：

· __attribute((aligned (n)))，讓所作用的結構成員對齊在n位元組自然邊界上。如果結構中有成員的長度大于n，則按照最大成員的長度來對齊。

· __attribute__ ((packed))，取消結構在編譯過程中的優化對齊，按照實際占用位元組數進行對齊。

4. 舉例說明

例1

struct test

{

char x1;

short x2;

float x3;

char x4;

};

由于編譯器預設情況下會對這個struct作自然邊界（有人說“自然對界”我覺得邊界更順口）對齊，結構的第一個成員x1，其偏移位址為0，占據了第1個位元組。第二個成員x2為short類型，其起始位址必須2位元組對界，是以，編譯器在x2和x1之間填充了一個空位元組。結構的第三個成員x3和第四個成員x4恰好落在其自然邊界位址上，在它們前面不需要額外的填充位元組。在test結構中，成員x3要求4位元組對界，是該結構所有成員中要求的最大邊界單元，因而test結構的自然對界條件為4位元組，編譯器在成員x4後面填充了3個空位元組。整個結構所占據空間為12位元組。

例2

#pragma pack(1) //讓編譯器對這個結構作1位元組對齊

#pragma pack() //取消1位元組對齊，恢複為預設4位元組對齊

這時候sizeof(struct test)的值為8。

例3

#define GNUC_PACKED __attribute__((packed))

struct PACKED test

}GNUC_PACKED;

這時候sizeof(struct test)的值仍為8。

二、深入了解

什麼是位元組對齊,為什麼要對齊?

TragicJun 發表于 2006-9-18 9:41:00 現代計算機中記憶體空間都是按照byte劃分的，從理論上講似乎對任何類型的變量的通路可以從任何位址開始，但實際情況是在通路特定類型變量的時候經常在特定的記憶體位址通路，這就需要各種類型資料按照一定的規則在空間上排列，而不是順序的一個接一個的排放，這就是對齊。

對齊的作用和原因：各個硬體平台對存儲空間的處理上有很大的不同。一些平台對某些特定類型的資料隻能從某些特定位址開始存取。比如有些架構的CPU在通路一個沒有進行對齊的變量的時候會發生錯誤,那麼在這種架構下程式設計必須保證位元組對齊.其他平台可能沒有這種情況，但是最常見的是如果不按照适合其平台要求對資料存放進行對齊，會在存取效率上帶來損失。比如有些平台每次讀都是從偶位址開始，如果一個int型（假設為32位系統）如果存放在偶位址開始的地方，那麼一個讀周期就可以讀出這32bit，而如果存放在奇位址開始的地方，就需要2個讀周期，并對兩次讀出的結果的高低位元組進行拼湊才能得到該32bit資料。顯然在讀取效率上下降很多。

二.位元組對齊對程式的影響:

先讓我們看幾個例子吧(32bit,x86環境,gcc編譯器):

設結構體如下定義：

struct A

int a;

char b;

short c;

struct B

現在已知32位機器上各種資料類型的長度如下:

char:1(有符号無符号同)

short:2(有符号無符号同)

int:4(有符号無符号同)

long:4(有符号無符号同)

float:4 double:8

那麼上面兩個結構大小如何呢?

結果是:

sizeof(strcut A)值為8

sizeof(struct B)的值卻是12

結構體A中包含了4位元組長度的int一個，1位元組長度的char一個和2位元組長度的short型資料一個,B也一樣;按理說A,B大小應該都是7位元組。

之是以出現上面的結果是因為編譯器要對資料成員在空間上進行對齊。上面是按照編譯器的預設設定進行對齊的結果,那麼我們是不是可以改變編譯器的這種預設對齊設定呢,當然可以.例如:

#pragma pack (2) /*指定按2位元組對齊*/

struct C

#pragma pack () /*取消指定對齊，恢複預設對齊*/

sizeof(struct C)值是8。

修改對齊值為1：

#pragma pack (1) /*指定按1位元組對齊*/

struct D

sizeof(struct D)值為7。

後面我們再講解#pragma pack()的作用.

三.編譯器是按照什麼樣的原則進行對齊的?

先讓我們看四個重要的基本概念：

1.資料類型自身的對齊值：

對于char型資料，其自身對齊值為1，對于short型為2，對于int,float,double類型，其自身對齊值為4，機關位元組。

2.結構體或者類的自身對齊值：其成員中自身對齊值最大的那個值。

3.指定對齊值：#pragma pack (value)時的指定對齊值value。

4.資料成員、結構體和類的有效對齊值：自身對齊值和指定對齊值中小的那個值。

有了這些值，我們就可以很友善的來讨論具體資料結構的成員和其自身的對齊方式。有效對齊值N是最終用來決定資料存放位址方式的值，最重要。有效對齊N，就是表示“對齊在N上”，也就是說該資料的"存放起始位址%N=0".而資料結構中的資料變量都是按定義的先後順序來排放的。第一個資料變量的起始位址就是資料結構的起始位址。結構體的成員變量要對齊排放，結構體本身也要根據自身的有效對齊值圓整(就是結構體成員變量占用總長度需要是對結構體有效對齊值的整數倍，結合下面例子了解)。這樣就不能了解上面的幾個例子的值了。

例子分析：

分析例子B；

假設B從位址空間0x0000開始排放。該例子中沒有定義指定對齊值，在筆者環境下，該值預設為4。第一個成員變量b的自身對齊值是1，比指定或者預設指定對齊值4小，是以其有效對齊值為1，是以其存放位址0x0000符合0x0000%1=0.第二個成員變量a，其自身對齊值為4，是以有效對齊值也為4，是以隻能存放在起始位址為0x0004到0x0007這四個連續的位元組空間中，複核0x0004%4=0,且緊靠第一個變量。第三個變量c,自身對齊值為2，是以有效對齊值也是2，可以存放在0x0008到0x0009這兩個位元組空間中，符合0x0008%2=0。是以從0x0000到0x0009存放的都是B内容。再看資料結構B的自身對齊值為其變量中最大對齊值(這裡是b）是以就是4，是以結構體的有效對齊值也是4。根據結構體圓整的要求，0x0009到0x0000=10位元組，（10＋2）％4＝0。是以0x0000A到0x000B也為結構體B所占用。故B從0x0000到0x000B共有12個位元組,sizeof(struct B)=12;其實如果就這一個就來說它已将滿足位元組對齊了,因為它的起始位址是0,是以肯定是對齊的,之是以在後面補充2個位元組,是因為編譯器為了實作結構數組的存取效率,試想如果我們定義了一個結構B的數組,那麼第一個結構起始位址是0沒有問題,但是第二個結構呢?按照數組的定義,數組中所有元素都是緊挨着的,如果我們不把結構的大小補充為4的整數倍,那麼下一個結構的起始位址将是0x0000A,這顯然不能滿足結構的位址對齊了,是以我們要把結構補充成有效對齊大小的整數倍.其實諸如:對于char型資料，其自身對齊值為1，對于short型為2，對于int,float,double類型，其自身對齊值為4，這些已有類型的自身對齊值也是基于數組考慮的,隻是因為這些類型的長度已知了,是以他們的自身對齊值也就已知了.

同理,分析上面例子C：

第一個變量b的自身對齊值為1，指定對齊值為2，是以，其有效對齊值為1，假設C從0x0000開始，那麼b存放在0x0000，符合0x0000%1=0;第二個變量，自身對齊值為4，指定對齊值為2，是以有效對齊值為2，是以順序存放在0x0002、0x0003、0x0004、0x0005四個連續位元組中，符合0x0002%2=0。第三個變量c的自身對齊值為2，是以有效對齊值為2，順序存放

在0x0006、0x0007中，符合0x0006%2=0。是以從0x0000到0x00007共八位元組存放的是C的變量。又C的自身對齊值為4，是以C的有效對齊值為2。又8%2=0,C隻占用0x0000到0x0007的八個位元組。是以sizeof(struct C)=8.

四.如何修改編譯器的預設對齊值?

1.在VC IDE中，可以這樣修改：[Project]|[Settings],c/c++頁籤Category的Code Generation選項的Struct Member Alignment中修改，預設是8位元組。

2.在編碼時，可以這樣動态修改：#pragma pack .注意:是pragma而不是progma.

五.針對位元組對齊,我們在程式設計中如何考慮?

如果在程式設計的時候要考慮節約空間的話,那麼我們隻需要假定結構的首位址是0,然後各個變量按照上面的原則進行排列即可,基本的原則就是把結構中的變量按照類型大小從小到大聲明,盡量減少中間的填補空間.還有一種就是為了以空間換取時間的效率,我們顯示的進行填補空間進行對齊,比如:有一種使用空間換時間做法是顯式的插入reserved成員：

struct A{

char a;

char reserved[3];//使用空間換時間

int b;

}

reserved成員對我們的程式沒有什麼意義,它隻是起到填補空間以達到位元組對齊的目的,當然即使不加這個成員通常編譯器也會給我們自動填補對齊,我們自己加上它隻是起到顯式的提醒作用.

六.位元組對齊可能帶來的隐患:

代碼中關于對齊的隐患，很多是隐式的。比如在強制類型轉換的時候。例如：

unsigned int i = 0x12345678;

unsigned char *p=NULL;

unsigned short *p1=NULL;

p=&i;

*p=0x00;

p1=(unsigned short *)(p+1);

*p1=0x0000;

最後兩句代碼，從奇數邊界去通路unsignedshort型變量，顯然不符合對齊的規定。

在x86上，類似的操作隻會影響效率，但是在MIPS或者sparc上，可能就是一個error,因為它們要求必須位元組對齊.

七.如何查找與位元組對齊方面的問題:

如果出現對齊或者指派問題首先檢視

1. 編譯器的big little端設定

2. 看這種體系本身是否支援非對齊通路

3. 如果支援看設定了對齊與否,如果沒有則看通路時需要加某些特殊的修飾來标志其特殊通路操作

舉例：

#include <stdio.h>

main()

{

struct A {

int a;

char b;

short c;

};

struct B {

#pragma pack (2) /*指定按2位元組對齊*/

struct C {

#pragma pack () /*取消指定對齊，恢複預設對齊*/

#pragma pack (1) /*指定按1位元組對齊*/

struct D {

#pragma pack ()/*取消指定對齊，恢複預設對齊*/

int s1=sizeof(struct A);

int s2=sizeof(struct B);

int s3=sizeof(struct C);

int s4=sizeof(struct D);

printf("%d\n",s1);

printf("%d\n",s2);

printf("%d\n",s3);

printf("%d\n",s4);

}

輸出：

修改代碼：

struct A {

// int a;

char b;

short c;

struct B {

輸出都是4，說明之前的int影響對齊！

看圖就明白了

C語言位元組對齊

繼續閱讀

C語言-----初階指針詳解

輸出蛇形矩陣 C語言輸出蛇形矩陣

1.54寸TFT ST7789液晶屏圖檔如何取模

三子棋——年輕人的第一款小遊戲前言正文總結

DOG（4）：解析器的部分實作細節先來說說parser一些可能迷惑的地方結果如何傳回?pcd其實是一回事最後的一點說明

NYOJ 269--VF

二叉樹三種周遊(先序，中序，後序)----超詳細引入先序周遊後序周遊中序周遊總結

UVA 110 Meta-Loopless Sorts

CRC32和CRC8校驗代碼，C語言版

241 Different Ways to Add Parentheses（C代碼版）

C語言：初學者必定看懂的注釋！！！猴子吃桃問題。猴子第一天摘下若幹個桃子，每天都吃了前一天剩下的一半零一個，到第10天早上想再吃的時候，就剩下一個桃子. 求第一天共摘多少個桃子。

[轉]九大排序算法——C語言實作及詳解

while 循環、do- while 循環和 for 循環之間的那點事C語言自學之三種循環比較

結構體：typedef與struct的差別

hdu7108哈希