天天看點

c99之 柔性數組成員

在講述柔性數組成員之前,首先要介紹一下不完整類型(incomplete type)。不完整類型是這樣一種類型,它缺乏足夠的資訊例如長度去描述一個完整的對象。

6.2.5 Types

incomplete types (types that describe objects but lack information needed to determine their sizes).

C與C++關于不完整類型的語義是一樣的。

前向聲明就是一種常用的不完整類型:

class base;

struct test;

base和test隻給出了聲明,沒有給出定義。不完整類型必須通過某種方式補充完整,才能使用它們進行執行個體化,否則隻能用于定義指針或引用,因為此時執行個體化的是指針或引用本身,不是base或test對象。

一個未知長度的數組也屬于不完整類型:

extern int a[];

extern不能去掉,因為數組的長度未知,不能作為定義出現。不完整類型的數組可以通過幾種方式補充完整才能使用,大括号形式的初始化就是其中一種方式:

int a[] = { 10, 20 };

柔性數組成員(flexible array member)也叫伸縮性數組成員,它的出現反映了C程式員對精煉代碼的極緻追求。這種代碼結構産生于對動态結構體的需求。在日常的程式設計中,有時候需要在結構體中存放一個長度動态的字元串,一般的做法,是在結構體中定義一個指針成員,這個指針成員指向該字元串所在的動态記憶體空間,例如:

struct test

{

       int a;

       double b;

       char *p;

};

p指向字元串。這種方法造成字元串與結構體是分離的,不利于操作,如果把字元串跟結構體直接連在一起,不是更好嗎?于是,可以把代碼修改為這樣:

char a[] = “hello world”;

struct test *PntTest = ( struct test* )malloc( sizeof( struct test ) + strlen( a ) + 1 );

strcpy( PntTest + 1, a );

這樣一來,( char* )( PntTest + 1 )就是字元串“hello world”的位址了(已經忽略p)。這時候p成了多餘的東西,可以去掉。但是,又産生了另外一個問題:老是使用( char* )( PntTest + 1 )不友善。如果能夠找出一種方法,既能直接引用該字元串,又不占用結構體的空間,就完美了,符合這種條件的代碼結構應該是一個非對象的符号位址,在結構體的尾部放置一個0長度的數組是一個絕妙的解決方案。不過,C/C++标準規定不能定義長度為0的數組,是以,有些編譯器就把0長度的數組成員作為自己的非标準擴充,例如:

struct test

{

       int a;

       double b;

       char c[0];

};

c就叫柔性數組成員,如果把PntTest指向的動态配置設定記憶體看作一個整體,c就是一個長度可以動态變化的結構體成員,柔性一詞來源于此。c的長度為0,是以它不占用test的空間,同時PntTest->c就是“hello world”的首位址,不需要再使用( char* )( PntTest + 1 )這麼醜陋的文法了。

鑒于這種代碼結構所産生的重要作用,C99甚至把它收入了标準中:

6.7.2.1 Structure and union specifiers

As a special case, the last element of a structure with more than one named member may have an incomplete array type; this is called a flexible array member.

C99使用不完整類型實作柔性數組成員,标準形式是這樣的:

struct test

{

       int a;

       double b;

       char c[];

};

c同樣不占用test的空間,隻作為一個符号位址存在,而且必須是結構體的最後一個成員。柔性數組成員不僅可以用于字元數組,還可以是元素為其它類型的數組,例如:

struct test

{

       int a;

       double b;

       float c[];

};

應當盡量使用标準形式,在非C99的場合,可以使用指針方法。有些人使用char a[1],這是非常不可取的,把這樣的a用作柔性數組成員會發生越界行為,雖然C/C++标準并沒有規定編譯器應當檢查越界,但也沒有規定不能檢查越界,為了一個小小的指針空間而犧牲移植性,是不值得的。

柔性數組到底如何使用呢?看下面例子:

typedef struct st_type

{

int i;

int a[0];

}type_a;

有些編譯器會報錯無法編譯可以改成:

typedef struct st_type

{

int i;

int a[];

}type_a;

這樣我們就可以定義一個可變長的結構體,用 sizeof(type_a)得到的隻有 4,就是

sizeof(i)=sizeof(int)。那個 0 個元素的數組沒有占用空間,而後我們可以進行變長操作了。通

過如下表達式給結構體配置設定記憶體:

type_a *p = (type_a*)malloc(sizeof(type_a)+100*sizeof(int));這樣我們為結構體指針 p 配置設定了一塊記憶體。用 p->item[n]就能簡單地通路可變長元素。

但是這時候我們再用 sizeof(*p)測試結構體的大小,發現仍然為 4。是不是很詭異?我們

不是給這個數組配置設定了空間麼?

别急,先回憶一下我們前面講過的“模子” 。在定義這個結構體的時候,模子的大小就

已經确定不包含柔性數組的記憶體大小。柔性數組隻是編外人員,不占結構體的編制。隻是說

在使用柔性數組時需要把它當作結構體的一個成員,僅此而已。再說白點,柔性數組其實與

結構體沒什麼關系,隻是“挂羊頭賣狗肉”而已,算不得結構體的正式成員。

需要說明的是:C89不支援這種東西,C99把它作為一種特例加入了标準。但是,C99

所支援的是 incomplete type,而不是 zero array,形同 int item[0];這種形式是非法的,C99支援的形式是形同 int item[];隻不過有些編譯器把 int item[0];作為非标準擴充來支援,而且在C99釋出之前已經有了這種非标準擴充了,C99釋出之後,有些編譯器把兩者合而為一了。當然,上面既然用 malloc函數配置設定了記憶體,肯定就需要用 free函數來釋放記憶體:

free(p);

經過上面的講解,相信你已經掌握了這個看起來似乎很神秘的東西。不過實在要是沒

掌握也無所謂,這個東西實在很少用。

【柔性數組結構成員

  C99中,結構中的最後一個元素允許是未知大小的數組,這就叫做柔性數組成員,但結構中的柔性數組成員前面必須至少一個其他成員。柔性數組成員允許結構中包含一個大小可變的數組。sizeof傳回的這種結構大小不包括柔性數組的記憶體。包含柔性數組成員的結構用malloc ()函數進行記憶體的動态配置設定,并且配置設定的記憶體應該大于結構的大小,以适應柔性數組的預期大小。】

C語言版:

type_a *p = (type_a*)malloc(sizeof(type_a)+100*sizeof(int));

C++語言版:

type_a *p = (type_a*)new char[sizeof(type_a)+100*sizeof(int)];

而釋放同樣簡單:

C語言版:

free(p);

C++語言版:

delete []p;