Linux 系統程式設計 —— C結構體之位域（位段）

有些資訊在存儲時，并不需要占用一個完整的位元組，而隻需占幾個或一個二進制位。例如在存放一個開關量時，隻有0和1 兩種狀态，用一位二進位即可。為了節省存儲空間，并使處理簡便，C語言又提供了一種資料結構，稱為“位域”或“位段”。所謂“位域”是把一個位元組中的二進位劃分為幾個不同的區域，并說明每個區域的位數。每個域有一個域名，允許在程式中按域名進行操作。這樣就可以把幾個不同的對象用一個位元組的二進制位域來表示。

一、位域的定義和位域變量的說明

位域定義與結構定義相仿，其形式為：

struct 位域結構名 
{

 位域清單

};

其中位域清單的形式為：

類型說明符 位域名：位域長度

位域變量的說明與結構變量說明的方式相同。可采用先定義後說明，同時定義說明或者直接說明這三種方式。例如：

struct bs
{
　　int a:8;
　　int b:2;
　　int c:6;
}data;

說明data為bs變量，共占兩個位元組。其中位域a占8位，位域b占2位，位域c占6位。對于位域的定義尚有以下幾點說明：

1. 一個位域必須存儲在同一個位元組中，不能跨兩個位元組。

如一個位元組所剩空間不夠存放另一位域時，應從下一單元起存放該位域。也可以有意使某位域從下一單元開始。例如：

struct bs
{
    unsigned a:4
    unsigned b:5 /*從下一單元開始存放*/
    unsigned c:4
}

2. 由于位域不允許跨兩個位元組，是以位域的長度不能大于一個位元組的長度。

3. 位域可以無位域名，這時它隻用來作填充或調整位置。無名的位域是不能使用的。例如：

struct k
{
    int a:1
    int :2 /*無位域名，該2位不能使用*/
    int b:3
    int c:2
};

舉個例子：

普通結構體記憶體示例：

struct
{
    double   a;//8 8 8  0-7 
    char     b;//1 8 1     8    8-11浪費
    int      c;//4 8 4    12-15
    int      d;//4 8 4    16-19   20-24浪費
}S;

解析：（vs下預設對齊數為8，linux下為4，以下環境為vs）

1.結構體中第一個成員a放在0偏移處，a是double類型，占8個位元組，對齊數為8，從0偏移處開始往後放，0-7.

2.b占1個位元組，對齊數為1（b自身大小為1，預設為8，較小值為1，即對齊數為1），8是1的倍數，是以從8偏移處開始放，8.

3.c占4個位元組，對齊數為4，9-11浪費，從12開始放c,12-15.

4.d占4個位元組，對齊數為4,16是4的倍數，從16開始放，16-19.

5.0-19是20個位元組，最大對齊數為8,8的倍數最小的為24，20-24浪費.

6.是以，該結構體的大小為24.

Linux 系統程式設計 —— C結構體之位域（位段）

位段大小的計算，及計算機的存儲方式：

struct 
{
    int  a : 2;
    int  b : 10;
    int  c : 5;
    int  d : 20;
}S;

注意：

（1）位段成員的類型必須指定為unsigned或int類型。

（2）一個位段必須存儲在同一存儲單元中，不能跨兩個單元。如果第一個單元空間不能容納下一個位段，則該空間不用，而從下一個單元起存放該位段。

（3）可以定義無名位段。

（4）從圖中可以看出位段是如何存儲的，a、b、c放在一個存儲單元，為4個位元組，剩下的空間放不下d,放在下一個存儲單元中，占4個位元組，共占8個位元組。

Linux 系統程式設計 —— C結構體之位域（位段）

二、位域的使用

#include <iostream>
#include <memory.h>
using namespace std;
struct A
{
    int a:5;
    int b:3;
};
int main(void)
{
    char str[100] = "0134324324afsadfsdlfjlsdjfl";
        struct A d;
    memcpy(&d, str, sizeof(A));
    cout << d.a << endl;
    cout << d.b << endl;
    return 0;
}

在32位x86機器上輸出：

$ ./langxun.exe
-16
1

解析：在預設情況下，為了友善對結構體内元素的通路和管理，當結構體内的元素長度都小于處理器的位數的時候，便以結構體裡面最長的元素為對其機關，即結構體的長度一定是最長的資料元素的整數倍；如果有結構體記憶體長度大于處理器位數的元素，那麼就以處理器的位數為對齊單元。由于是32位處理器，而且結構體中a和b元素類型均為int（也是4個位元組），是以結構體的A占用記憶體為4個位元組。

上例程式中定義了位域結構A，兩個個位域為a（占用5位），b（占用3位），是以a和b總共占用了結構A一個位元組（低位的一個位元組）。

當程式運作到14行時，d記憶體配置設定情況：

高位 00110100 00110011   00110001    00110000 低位
       '4'       '3'       '1'          '0'  
 其中d.a和d.b占用d低位一個位元組（00110000）,d.a : 10000, d.b : 001

d.a記憶體中二進制表示為10000，由于d.a為有符号的整型變量，輸出時要對符号位進行擴充，是以結果為-16（二進制為11111111111111111111111111110000）

d.b記憶體中二進制表示為001，由于d.b為有符号的整型變量，輸出時要對符号位進行擴充，是以結果為1（二進制為00000000000000000000000000000001）

三、位域的對齊

　　如果結構體中含有位域(bit-field)，那麼VC中準則是：

　　1) 如果相鄰位域字段的類型相同，且其位寬之和小于類型的sizeof大小，則後面的字段将緊鄰前一個字段存儲，直到不能容納為止；

　　2) 如果相鄰位域字段的類型相同，但其位寬之和大于類型的sizeof大小，則後面的字段将從新的存儲單元開始，其偏移量為其類型大小的整數倍；

　　3) 如果相鄰的位域字段的類型不同，則各編譯器的具體實作有差異，VC6采取不壓縮方式（不同位域字段存放在不同的位域類型位元組中），Dev-C++和GCC都采取壓縮方式；

　　系統會先為結構體成員按照對齊方式配置設定空間和填塞（padding）,然後對變量進行位域操作。

四、位域與資料類型uint8_t uint16_t uint32_t uint64_t size_t ssize_t

參考：https://blog.csdn.net/lzx_bupt/article/details/7066577

C語言中好像沒有這種資料類型，但是在實際應用的過程中，發現許多人的代碼中都存在這種表示方式。其實uintX-t就是通過typedef定義的，利用預編譯和typedef可提高效率也友善代碼移植。總結如下：

typedef unsigned char uint8_t; //無符号8位數

typedef signed char int8_t; //有符号8位數

typedef unsigned int uint16_t; //無符号16位數

typedef signed int int16_t; //有符号16位數

typedef unsigned long uint32_t; //無符号32位數

typedef signed long int32_t; //有符号32位數

typedef float float32; //單精度浮點數

typedef double float64; //雙精度浮點數

一般來說整形對應的*_t類型為：

uint8_t為1位元組

uint16_t為2位元組

uint32_t為4位元組

uint64_t為8位元組

uint8_t / uint16_t / uint32_t /uint64_t 是什麼資料類型

這些資料類型是 C99 中定義的，具體定義在：/usr/include/stdint.h ISO C99: 7.18 Integer types <stdint.h>

#ifndef __int8_t_defined
# define __int8_t_defined
typedef signed char             int8_t; 
typedef short int               int16_t;
typedef int                     int32_t;
# if __WORDSIZE == 64
typedef long int                int64_t;
# else
__extension__
typedef long long int           int64_t;
# endif
#endif
 
/* Unsigned.  */
typedef unsigned char           uint8_t;
typedef unsigned short int      uint16_t;
#ifndef __uint32_t_defined
typedef unsigned int            uint32_t;
# define __uint32_t_defined
#endif
#if __WORDSIZE == 64
typedef unsigned long int       uint64_t;
#else
__extension__
typedef unsigned long long int  uint64_t;
#endif

格式化輸出：

unit64_t %llu

unit32_t %u

unit16_t %hu

unit8_t %d

舉例：

#include<stdio.h>
#include<stdint.h>

struct A
{
        uint8_t a:1;
        uint8_t b:4;
};
int main()
{

        struct A myA;
        printf("A size is %d\n",sizeof(myA));
        myA.a=1;
        myA.b=13;
        printf("myA.a is %c\n",myA.a);
        printf("myA.a is %d\n",myA.a);
        printf("myA.b is %c\n",myA.b);
        printf("myA.b is %d\n",myA.b);
        printf("end\n");

        return 0;
}

32位系統輸出結果：

[[email protected] tmp]# ./a.out 
A size is 1
myA.a is 
myA.a is 1
myA.b is 
myA.b is 13
end

Linux 系統程式設計 —— C結構體之位域（位段）

一、位域的定義和位域變量的說明

二、位域的使用

三、位域的對齊

四、位域與資料類型uint8_t uint16_t uint32_t uint64_t size_t ssize_t

繼續閱讀

C語言：初學者必定看懂的注釋！！！猴子吃桃問題。猴子第一天摘下若幹個桃子，每天都吃了前一天剩下的一半零一個，到第10天早上想再吃的時候，就剩下一個桃子. 求第一天共摘多少個桃子。

Ubuntu14.04 LTS下安裝mongodb

[轉]九大排序算法——C語言實作及詳解

while 循環、do- while 循環和 for 循環之間的那點事C語言自學之三種循環比較

httpd服務的部署、啟動、配置和簡單優化一、部署二、啟動三、配置檔案

配置網頁内容通路

手動安裝Intel network I217-LM網卡的Linux驅動

禁止ubuntu系統彈出報錯界面

Ubuntu Linux下Apache的配置檔案

結構體：typedef與struct的差別

samba伺服器的功能

【Linux】UDP廣播封包接收速率問題

Linux裝置模型（中）之上層容器

PowerPC平台 Linux移植三

hdu7108哈希