文章目录
-
- C语言——自定义类型详解(结构体)
- 结构体
- 结构体的声明
- 结构体的自引用
- 结构体变量的定义和初始化
- 结构体内存对齐
- 修改默认对齐数
- 结构体传参
- 位段
C语言——自定义类型详解(结构体)
本章重点:
结构体
1.结构体类型的声明
2.结构体的自引用
3.结构体变量的定义和初始化
4.结构体内存对齐
5.结构体传参
6.结构体实现位段(位段的填充&可移植性)
枚举
1.枚举类型的定义
2.枚举的优点
3.枚举的使用
联合
1.联合类型的定义
2.联合的特点
3.联合大小的计算
结构体
结构体的声明
struct tag
{
member_list;
}variable_list;
例如描述一个学生:
struct Stu
{
char name[20];//姓名
int age;//年龄
char sex[5];//性别
char id[20];//学号
};
特殊的声明
在声明结构体的时候,可以不完全的声明
比如:
struct
{
int a;
char b;
float c;
}x;
struct
{
int a;
char b;
float c;
}a[20], *p;
上面的两个结构体省略了标签tag
那么问题来了?
//在上面的代码基础下,下面的代码是否合法?
p = &x;
**警告:**编译器会把上面的两个声明当成完全不同类型的结构体,所以是非法的
结构体的自引用
正确的自引用方式
struct Node
{
int data;
struct Node* next;
};
这样的代码是错误的
typedef struct
{
int data;
Node* next;
}Node;
//解决方案
typedef struct Node
{
int data;
struct Node* next;
}Node;
结构体变量的定义和初始化
有了结构体类型,那如何定义变量呢
struct Point
{
int x;
int y;
}p1;//声明类型的同时定义变量p1
struct Point p2;//定义结构体变量p2
//初始化:定义变量的同时赋初始值
struct Point p3 = { 1,2 };
struct Stu
{
char name[20];
int age;
};
struct Stu s = { "zhangsan",20 };
struct Node
{
int data;
struct Point p;
struct Node* next;
}n1 = {10,{4,5},NULL};//结构体嵌套初始化
struct Node n2 = { 20,{5,6},NULL };
结构体内存对齐
我们深入讨论一个问题:如何计算结构体的大小
这也是一个热门的考点:结构体内存对齐
//代码一
struct S1
{
char c1;
int i;
char c2;
};
int main()
{
struct S1 s = { 0 };
printf("%d\n", sizeof(s));
return 0;
}
//代码二
struct S1
{
char c1;
char c2;
int i;
};
int main()
{
struct S1 s = { 0 };
printf("%d\n", sizeof(s));
return 0;
}
代码一和代码二的结果分别是12和8,为什么存储的是一样的数据,只是位置不同,就导致大小不同了呢
如何计算?首先要掌握结构体的对齐规则
1.第一个成员在与结构体变量偏移量为0的地址处
2.其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处
对齐数 = 编译器默认的一个对齐数与该成员大小的较小值
vs编译器默认的值是8
Linux中的默认值是4
3.结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍
4.如果嵌套了结构体的情况下,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍
结构体嵌套问题计算大小
struct S1
{
char c1;
int i;
char c2;
};
struct S2
{
char c1;
struct S1 s;
double d;
};
int main()
{
struct S2 s2 = { 0 };
printf("%d\n", sizeof(s2));
return 0;
}
为什么存在内存对齐
- 平台原因(移植原因):不是所有硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常
- 性能原因:数据结构(尤其是栈)应该尽可能的在自然边界上对齐,原因在于:为了访问未对齐的内存,处理器需要作两次内存访问,而对齐的内存访问仅需要一次访问
总体来说:
结构体的内存对齐是拿空间换取时间的做法
那么在设计结构体的时候,我们既要满足对齐,又要节省空间,如何做到:
让占用空间小的成员尽量集中在一起
修改默认对齐数
#pragma这个预处理指令,可以改变我们的默认对齐数
#pragma pack(4)//设置默认对齐数为8
#pragma pack()//取消设置的默认对齐数,还原为默认
#pragma pack(1)//设置默认对齐数为8
结论:
结构体在对齐方式不合适的时候,我们可以自己更改默认对齐数
百度面试题
写一个宏,计算结构体中某变量对于首地址的偏移,并给出说明
考察:offsetof 宏的实现
#include <stddef.h>
#include <stdio.h>
struct S
{
char c;
int a;
double d;
};
int main()
{
printf("%d\n", offsetof(struct S, c));
printf("%d\n", offsetof(struct S, a));
printf("%d\n", offsetof(struct S, d));
return 0;
}
结构体传参
直接看代码:
struct S
{
int data[1000];
int num;
};
struct S s = { {1,2,3,4},1000 };
//结构体传参
void print1(struct S s)
{
printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
printf("%d\n", ps->num);
}
int main()
{
print1(s);//传结构体
print2(&s);//传结构体的地址
return 0;
}
上面的print1和print2函数哪个更好?
答案是:首选print2函数;原因:
函数传参的时候,参数是需要压栈的,会有时间和空间的系统开销
如果传递了一个结构体对象的时候,结构体过大,参数压栈的系统开销比较大,所以会导致性能的下降
**结论:**结构体传参的时候,要传结构体的地址。
位段
什么是位段?
位段的声明和结构是类似的,有两个不同:
1.位段的成员必须是int、unsigned int或signed int
位段的成员名后面有一个冒号和数字
比如:
struct A
{
int a : 2;
int b : 5;
int c : 10;
int d : 30;
};
A就是一个位段类型
那么位段A的大小是多少呢?
位段的内存分配
- 位段的成员可以是 int unsigned int signed int 或者是char(属于整形家族)类型
- 位段的空间上是按照需要以四个字节(int)或者一个字节(char)的方式开辟的
- 位段涉及很多不确定的因素,位段是不跨平台的,注重可移植的程序应该避免使用位段
例子:
struct S
{
int a : 2;
int b : 5;
int c : 10;
int d : 30;
};
int main()
{
struct S s = { 0 };
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
//那么空间是如何开辟的呢
return 0;
}
位段的跨平台问题
1.int 位段被当成有符号数还是无符号数是不确定的
2.位段中最大位的数目不能确定,(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题)
3.位段中的成员在内存中从左向右分配,还是从右向左分配尚未定义
4.当一个结构包含两个位段,第二个位段成员比较大,无法容纳第一个位段剩余的位时,是舍弃剩余的位段还是利用,这是不确定的
总结:
跟结构相比,位段可以达到同样的效果,但是可以很好地节省空间,但是有跨平台的问题存在