天天看點

Linux 系統程式設計 —— C結構體之位域(位段)

        有些資訊在存儲時,并不需要占用一個完整的位元組, 而隻需占幾個或一個二進制位。例如在存放一個開關量時,隻有0和1 兩種狀态, 用一位二進位即可。為了節省存儲空間,并使處理簡便,C語言又提供了一種資料結構,稱為“位域”或“位段”。所謂“位域”是把一個位元組中的二進位劃分為幾個不同的區域, 并說明每個區域的位數。每個域有一個域名,允許在程式中按域名進行操作。 這樣就可以把幾個不同的對象用一個位元組的二進制位域來表示。

一、位域的定義和位域變量的說明

位域定義與結構定義相仿,其形式為: 

struct 位域結構名 
{

 位域清單

};
           

其中位域清單的形式為:

類型說明符 位域名:位域長度
           

位域變量的說明與結構變量說明的方式相同。 可采用先定義後說明,同時定義說明或者直接說明這三種方式。例如:

struct bs
{
  int a:8;
  int b:2;
  int c:6;
}data;
           

說明data為bs變量,共占兩個位元組。其中位域a占8位,位域b占2位,位域c占6位。對于位域的定義尚有以下幾點說明:

1. 一個位域必須存儲在同一個位元組中,不能跨兩個位元組。

如一個位元組所剩空間不夠存放另一位域時,應從下一單元起存放該位域。也可以有意使某位域從下一單元開始。例如:

struct bs
{
    unsigned a:4
    unsigned b:5 /*從下一單元開始存放*/
    unsigned c:4
}
           

2. 由于位域不允許跨兩個位元組,是以位域的長度不能大于一個位元組的長度。

3. 位域可以無位域名,這時它隻用來作填充或調整位置。無名的位域是不能使用的。例如:

struct k
{
    int a:1
    int :2 /*無位域名,該2位不能使用*/
    int b:3
    int c:2
}; 
           

舉個例子:

普通結構體記憶體示例:

struct
{
    double   a;//8 8 8  0-7 
    char     b;//1 8 1     8    8-11浪費
    int      c;//4 8 4    12-15
    int      d;//4 8 4    16-19   20-24浪費
}S;
           

解析:(vs下預設對齊數為8,linux下為4,以下環境為vs)

1.結構體中第一個成員a放在0偏移處,a是double類型,占8個位元組,對齊數為8,從0偏移處開始往後放,0-7.

2.b占1個位元組,對齊數為1(b自身大小為1,預設為8,較小值為1,即對齊數為1),8是1的倍數,是以從8偏移處開始放,8.

3.c占4個位元組,對齊數為4,9-11浪費,從12開始放c,12-15.

4.d占4個位元組,對齊數為4,16是4的倍數,從16開始放,16-19.

5.0-19是20個位元組,最大對齊數為8,8的倍數最小的為24,20-24浪費.

6.是以,該結構體的大小為24.

Linux 系統程式設計 —— C結構體之位域(位段)

位段大小的計算,及計算機的存儲方式:

struct 
{
    int  a : 2;
    int  b : 10;
    int  c : 5;
    int  d : 20;
}S;
           

注意:

(1)位段成員的類型必須指定為unsigned或int類型。

(2)一個位段必須存儲在同一存儲單元中,不能跨兩個單元。如果第一個單元空間不能容納下一個位段,則該空間不用,而從下一個單元起存放該位段。

(3)可以定義無名位段。

(4)從圖中可以看出位段是如何存儲的,a、b、c放在一個存儲單元,為4個位元組,剩下的空間放不下d,放在下一個存儲單元中,占4個位元組,共占8個位元組。

Linux 系統程式設計 —— C結構體之位域(位段)

二、位域的使用

#include <iostream>
#include <memory.h>
using namespace std;
struct A
{
    int a:5;
    int b:3;
};
int main(void)
{
    char str[100] = "0134324324afsadfsdlfjlsdjfl";
        struct A d;
    memcpy(&d, str, sizeof(A));
    cout << d.a << endl;
    cout << d.b << endl;
    return 0;
}
           

在32位x86機器上輸出:

$ ./langxun.exe
-16
1
           

解析:在預設情況下,為了友善對結構體内元素的通路和管理,當結構體内的元素長度都小于處理器的位數的時候,便以結構體裡面最長的元素為對其機關,即結構體的長度一定是最長的資料元素的整數倍;如果有結構體記憶體長度大于處理器位數的元素,那麼就以處理器的位數為對齊單元。由于是32位處理器,而且結構體中a和b元素類型均為int(也是4個位元組),是以結構體的A占用記憶體為4個位元組。

上例程式中定義了位域結構A,兩個個位域為a(占用5位),b(占用3位),是以a和b總共占用了結構A一個位元組(低位的一個位元組)。

當程式運作到14行時,d記憶體配置設定情況:

高位 00110100 00110011   00110001    00110000 低位
       '4'       '3'       '1'          '0'  
 其中d.a和d.b占用d低位一個位元組(00110000),d.a : 10000, d.b : 001      

 d.a記憶體中二進制表示為10000,由于d.a為有符号的整型變量,輸出時要對符号位進行擴充,是以結果為-16(二進制為11111111111111111111111111110000)

 d.b記憶體中二進制表示為001,由于d.b為有符号的整型變量,輸出時要對符号位進行擴充,是以結果為1(二進制為00000000000000000000000000000001)

 三、位域的對齊

  如果結構體中含有位域(bit-field),那麼VC中準則是:

  1) 如果相鄰位域字段的類型相同,且其位寬之和小于類型的sizeof大小,則後面的字段将緊鄰前一個字段存儲,直到不能容納為止;

  2) 如果相鄰位域字段的類型相同,但其位寬之和大于類型的sizeof大小,則後面的字段将從新的存儲單元開始,其偏移量為其類型大小的整數倍;

  3) 如果相鄰的位域字段的類型不同,則各編譯器的具體實作有差異,VC6采取不壓縮方式(不同位域字段存放在不同的位域類型位元組中),Dev-C++和GCC都采取壓縮方式;

  系統會先為結構體成員按照對齊方式配置設定空間和填塞(padding),然後對變量進行位域操作。

四、位域與資料類型uint8_t uint16_t uint32_t uint64_t size_t ssize_t

參考:https://blog.csdn.net/lzx_bupt/article/details/7066577

C語言中好像沒有這種資料類型,但是在實際應用的過程中,發現許多人的代碼中都存在這種表示方式。其實uintX-t就是通過typedef定義的,利用預編譯和typedef可提高效率也友善代碼移植。總結如下:

    typedef unsigned char   uint8_t;     //無符号8位數

    typedef signed   char   int8_t;      //有符号8位數

    typedef unsigned int    uint16_t;    //無符号16位數

    typedef signed   int    int16_t;     //有符号16位數

    typedef unsigned long   uint32_t;    //無符号32位數

    typedef signed   long   int32_t;     //有符号32位數

    typedef float           float32;     //單精度浮點數

    typedef double          float64;     //雙精度浮點數

一般來說整形對應的*_t類型為:

    uint8_t為1位元組    

    uint16_t為2位元組  

    uint32_t為4位元組    

    uint64_t為8位元組    

uint8_t / uint16_t / uint32_t /uint64_t 是什麼資料類型

這些資料類型是 C99 中定義的,具體定義在:/usr/include/stdint.h    ISO C99: 7.18 Integer types <stdint.h>

#ifndef __int8_t_defined
# define __int8_t_defined
typedef signed char             int8_t; 
typedef short int               int16_t;
typedef int                     int32_t;
# if __WORDSIZE == 64
typedef long int                int64_t;
# else
__extension__
typedef long long int           int64_t;
# endif
#endif
 
/* Unsigned.  */
typedef unsigned char           uint8_t;
typedef unsigned short int      uint16_t;
#ifndef __uint32_t_defined
typedef unsigned int            uint32_t;
# define __uint32_t_defined
#endif
#if __WORDSIZE == 64
typedef unsigned long int       uint64_t;
#else
__extension__
typedef unsigned long long int  uint64_t;
#endif
           

格式化輸出:

unit64_t     %llu   

unit32_t     %u

unit16_t    %hu

unit8_t    %d

舉例:

#include<stdio.h>
#include<stdint.h>

struct A
{
        uint8_t a:1;
        uint8_t b:4;
};
int main()
{

        struct A myA;
        printf("A size is %d\n",sizeof(myA));
        myA.a=1;
        myA.b=13;
        printf("myA.a is %c\n",myA.a);
        printf("myA.a is %d\n",myA.a);
        printf("myA.b is %c\n",myA.b);
        printf("myA.b is %d\n",myA.b);
        printf("end\n");

        return 0;
}
           

32位系統輸出結果:

[[email protected] tmp]# ./a.out 
A size is 1
myA.a is 
myA.a is 1
myA.b is 
myA.b is 13
end
           

繼續閱讀