有些資訊在存儲時,并不需要占用一個完整的位元組, 而隻需占幾個或一個二進制位。例如在存放一個開關量時,隻有0和1 兩種狀态, 用一位二進位即可。為了節省存儲空間,并使處理簡便,C語言又提供了一種資料結構,稱為“位域”或“位段”。所謂“位域”是把一個位元組中的二進位劃分為幾個不同的區域, 并說明每個區域的位數。每個域有一個域名,允許在程式中按域名進行操作。 這樣就可以把幾個不同的對象用一個位元組的二進制位域來表示。
一、位域的定義和位域變量的說明
位域定義與結構定義相仿,其形式為:
struct 位域結構名
{
位域清單
};
其中位域清單的形式為:
類型說明符 位域名:位域長度
位域變量的說明與結構變量說明的方式相同。 可采用先定義後說明,同時定義說明或者直接說明這三種方式。例如:
struct bs
{
int a:8;
int b:2;
int c:6;
}data;
說明data為bs變量,共占兩個位元組。其中位域a占8位,位域b占2位,位域c占6位。對于位域的定義尚有以下幾點說明:
1. 一個位域必須存儲在同一個位元組中,不能跨兩個位元組。
如一個位元組所剩空間不夠存放另一位域時,應從下一單元起存放該位域。也可以有意使某位域從下一單元開始。例如:
struct bs
{
unsigned a:4
unsigned b:5 /*從下一單元開始存放*/
unsigned c:4
}
2. 由于位域不允許跨兩個位元組,是以位域的長度不能大于一個位元組的長度。
3. 位域可以無位域名,這時它隻用來作填充或調整位置。無名的位域是不能使用的。例如:
struct k
{
int a:1
int :2 /*無位域名,該2位不能使用*/
int b:3
int c:2
};
舉個例子:
普通結構體記憶體示例:
struct
{
double a;//8 8 8 0-7
char b;//1 8 1 8 8-11浪費
int c;//4 8 4 12-15
int d;//4 8 4 16-19 20-24浪費
}S;
解析:(vs下預設對齊數為8,linux下為4,以下環境為vs)
1.結構體中第一個成員a放在0偏移處,a是double類型,占8個位元組,對齊數為8,從0偏移處開始往後放,0-7.
2.b占1個位元組,對齊數為1(b自身大小為1,預設為8,較小值為1,即對齊數為1),8是1的倍數,是以從8偏移處開始放,8.
3.c占4個位元組,對齊數為4,9-11浪費,從12開始放c,12-15.
4.d占4個位元組,對齊數為4,16是4的倍數,從16開始放,16-19.
5.0-19是20個位元組,最大對齊數為8,8的倍數最小的為24,20-24浪費.
6.是以,該結構體的大小為24.

位段大小的計算,及計算機的存儲方式:
struct
{
int a : 2;
int b : 10;
int c : 5;
int d : 20;
}S;
注意:
(1)位段成員的類型必須指定為unsigned或int類型。
(2)一個位段必須存儲在同一存儲單元中,不能跨兩個單元。如果第一個單元空間不能容納下一個位段,則該空間不用,而從下一個單元起存放該位段。
(3)可以定義無名位段。
(4)從圖中可以看出位段是如何存儲的,a、b、c放在一個存儲單元,為4個位元組,剩下的空間放不下d,放在下一個存儲單元中,占4個位元組,共占8個位元組。
二、位域的使用
#include <iostream>
#include <memory.h>
using namespace std;
struct A
{
int a:5;
int b:3;
};
int main(void)
{
char str[100] = "0134324324afsadfsdlfjlsdjfl";
struct A d;
memcpy(&d, str, sizeof(A));
cout << d.a << endl;
cout << d.b << endl;
return 0;
}
在32位x86機器上輸出:
$ ./langxun.exe
-16
1
解析:在預設情況下,為了友善對結構體内元素的通路和管理,當結構體内的元素長度都小于處理器的位數的時候,便以結構體裡面最長的元素為對其機關,即結構體的長度一定是最長的資料元素的整數倍;如果有結構體記憶體長度大于處理器位數的元素,那麼就以處理器的位數為對齊單元。由于是32位處理器,而且結構體中a和b元素類型均為int(也是4個位元組),是以結構體的A占用記憶體為4個位元組。
上例程式中定義了位域結構A,兩個個位域為a(占用5位),b(占用3位),是以a和b總共占用了結構A一個位元組(低位的一個位元組)。
當程式運作到14行時,d記憶體配置設定情況:
高位 00110100 00110011 00110001 00110000 低位
'4' '3' '1' '0'
其中d.a和d.b占用d低位一個位元組(00110000),d.a : 10000, d.b : 001
d.a記憶體中二進制表示為10000,由于d.a為有符号的整型變量,輸出時要對符号位進行擴充,是以結果為-16(二進制為11111111111111111111111111110000)
d.b記憶體中二進制表示為001,由于d.b為有符号的整型變量,輸出時要對符号位進行擴充,是以結果為1(二進制為00000000000000000000000000000001)
三、位域的對齊
如果結構體中含有位域(bit-field),那麼VC中準則是:
1) 如果相鄰位域字段的類型相同,且其位寬之和小于類型的sizeof大小,則後面的字段将緊鄰前一個字段存儲,直到不能容納為止;
2) 如果相鄰位域字段的類型相同,但其位寬之和大于類型的sizeof大小,則後面的字段将從新的存儲單元開始,其偏移量為其類型大小的整數倍;
3) 如果相鄰的位域字段的類型不同,則各編譯器的具體實作有差異,VC6采取不壓縮方式(不同位域字段存放在不同的位域類型位元組中),Dev-C++和GCC都采取壓縮方式;
系統會先為結構體成員按照對齊方式配置設定空間和填塞(padding),然後對變量進行位域操作。
四、位域與資料類型uint8_t uint16_t uint32_t uint64_t size_t ssize_t
參考:https://blog.csdn.net/lzx_bupt/article/details/7066577
C語言中好像沒有這種資料類型,但是在實際應用的過程中,發現許多人的代碼中都存在這種表示方式。其實uintX-t就是通過typedef定義的,利用預編譯和typedef可提高效率也友善代碼移植。總結如下:
typedef unsigned char uint8_t; //無符号8位數
typedef signed char int8_t; //有符号8位數
typedef unsigned int uint16_t; //無符号16位數
typedef signed int int16_t; //有符号16位數
typedef unsigned long uint32_t; //無符号32位數
typedef signed long int32_t; //有符号32位數
typedef float float32; //單精度浮點數
typedef double float64; //雙精度浮點數
一般來說整形對應的*_t類型為:
uint8_t為1位元組
uint16_t為2位元組
uint32_t為4位元組
uint64_t為8位元組
uint8_t / uint16_t / uint32_t /uint64_t 是什麼資料類型
這些資料類型是 C99 中定義的,具體定義在:/usr/include/stdint.h ISO C99: 7.18 Integer types <stdint.h>
#ifndef __int8_t_defined
# define __int8_t_defined
typedef signed char int8_t;
typedef short int int16_t;
typedef int int32_t;
# if __WORDSIZE == 64
typedef long int int64_t;
# else
__extension__
typedef long long int int64_t;
# endif
#endif
/* Unsigned. */
typedef unsigned char uint8_t;
typedef unsigned short int uint16_t;
#ifndef __uint32_t_defined
typedef unsigned int uint32_t;
# define __uint32_t_defined
#endif
#if __WORDSIZE == 64
typedef unsigned long int uint64_t;
#else
__extension__
typedef unsigned long long int uint64_t;
#endif
格式化輸出:
unit64_t %llu
unit32_t %u
unit16_t %hu
unit8_t %d
舉例:
#include<stdio.h>
#include<stdint.h>
struct A
{
uint8_t a:1;
uint8_t b:4;
};
int main()
{
struct A myA;
printf("A size is %d\n",sizeof(myA));
myA.a=1;
myA.b=13;
printf("myA.a is %c\n",myA.a);
printf("myA.a is %d\n",myA.a);
printf("myA.b is %c\n",myA.b);
printf("myA.b is %d\n",myA.b);
printf("end\n");
return 0;
}
32位系統輸出結果:
[[email protected] tmp]# ./a.out
A size is 1
myA.a is
myA.a is 1
myA.b is
myA.b is 13
end