(一)深入理解typedef
typedef作为类型定义关键字,用于在原有数据类型(包括基本类型、构造类型和指针等)的基础上,由用户自定义新的类型名称。
在编程中使用typedef的好处,除了为变量取一个简单易记且意义明确的新名称之外,还可以简化一些比较复杂的类型声明。比如:
typedef int INT32;
将INT32定义为与int具有相同意义的名字,这样类型INT32就可用于类型声明和类型转换了,它和类型int完全相同。比如:
INT32 a; // 定义整型变量a
(INT32) b; // 将其它的类型b转换为整型
既然已经有了int这个名称,为什么还要再取一个名称呢?主要是为了提高程序的可移植性。比如,某种微处理器的int为16位,long为32位。如果要将该程序移植到另一种体系结构的微处理器,假设编译器的int为32位,long为64位,而只有short才是16位的,因此必须将程序中的int全部替换为short,long全部替换为int,如此这样修改势必工作量巨大且容易出错。如果将它取一个新的名称,然后在程序中全部用新取的名称,那么要移植的工作仅仅只是修改定义这些新名称即可。也就是说,只需要将以前的:
typedef int INT16;
typedef long INT32;
替换成:
typedef short INT16;
typedef int INT32;
由此可见,typedef声明并没有创建一个新类型,而是为某个已经存在的类型增加一个新的名字而已。用这种方式声明的变量与通过声明方式声明的变量具有完全相同的属性。
至于typedef如何简化复杂的类型声明,将在后续的章节中详细阐述。
综上所述,如果在变量定义的前面加上typedef,即可定义该变量的类型。比如:
int size;
这里定义了一个整型变量size,当加上typedef后:
typedef int size;
那么,size就成为了上面的size变量的类型,即int类型。既然size是一个类型,当然可以用它来定义另外一个变量。即:
size a;
类似于变量的类型定义,也可以用typedef声明新的类型,比如:
char *ptr_to_char; // 声明ptr_to_char为一个指向字符的指针
typedef char ptr_to_char; // 声明ptr_to_char为指向char的指针类型
ptr_to_char pch; // 声明pch是一个指向字符的指针
对于初学者来说,也许会产生一个这样的疑问,为什么不使用#define创建新的类型名?比如:
#define ptr_to_char char*
ptr_to_char pch1, pch2;
由于有了“#define ptr_to_char char*”,因此“ptr_to_char pch1, pch2”可以展开为
char *pch1, pch2;
所以pch2为char型变量。如果用typedef来定义的话,其代码如下:
typedef char* ptr_to_char;
ptr_to_char pch1, pch2;
则“ptr_to_char pch1, pch2”等价于
char *pch1;
char *pch2;
因此,pch1、pch2都是指针。
虽然#define语句看起来象typedef,但实际上却有本质上的差别。对于#define来说,仅在编译前对源代码进行了字符串替换处理;而对于typedef来说,它建立了一个新的数据类型别名。由此可见,只是将pch1定义为指针变量,却并没有实现程序员的意图,而是将pch2定义成了char型变量。
在指针函数中,有这样一类函数,它们也返回指针,但是这个指针不是指向int、char之类的基本类型,而是指向函数。对于初学者,别说写出这样的函数声明,就是看到这样的写法也是一头雾水。比如,下面的语句:
int (*ff(int))(int *, int);
我们用上面介绍的方法分析一下,ff首先与后面的“()”结合,即:
int (*(ff(int)))(int *, int); // 用括号将ff(int)再括起来
也就意味着,ff是一个函数。
接着与前面的“*”结合,说明ff函数的返回值是一个指针。然后再与后面的“()”结合,也就是说,该指针指向的是一个函数。
这种写法确实让人非常难懂,以至于一些初学者产生误解,认为写出别人看不懂的代码才能显示自己水平高。而事实上恰好相反,能否写出通俗易懂的代码是衡量程序员是否优秀的标准。一般来说,用typedef关键字会使该声明更简单易懂。在前面我们已经见过:
int (*PF)(int *, int);
也就是说,PF是一个函数指针“变量”。当使用typedef声明后,则PF就成为了一个函数指针“类型”,即:
typedef int (*PF)(int *, int);
这样就定义了返回值的类型。然后,再用PF作为返回值来声明函数:
PF ff(int);
返回函数指针会用在什么地方呢?且听下文分解。
(二)深入理解函数指针与指针函数
1.指针函数的定义
顾名思义,指针函数即返回指针的函数。其一般定义形式如下:
类型名 *函数名(函数参数表列);
其中,后缀运算符括号“()”表示这是一个函数,其前缀运算符星号“*”表示此函数为指针型函数,其函数值为指针,即它带回来的值的类型为指针,当调用这个函数后,将得到一个“指向返回值为…的指针(地址),“类型名”表示函数返回的指针指向的类型”。
“(函数参数表列)”中的括号为函数调用运算符,在调用语句中,即使函数不带参数,其参数表的一对括号也不能省略。其示例如下:
int *pfun(int, int);
由于“*”的优先级低于“()”的优先级,因而pfun首先和后面的“()”结合,也就意味着,pfun是一个函数。即:
int *(pfun(int, int));
接着再和前面的“*”结合,说明这个函数的返回值是一个指针。由于前面还有一个int,也就是说,pfun是一个返回值为整型指针的函数。
我们不妨来再看一看,指针函数与函数指针有什么区别?
int (*pfun)(int, int);
通过括号强行将pfun首先与“*”结合,也就意味着,pfun是一个指针,接着与后面的“()”结合,说明该指针指向的是一个函数,然后再与前面的int结合,也就是说,该函数的返回值是int。由此可见,pfun是一个指向返回值为int的函数的指针。
虽然它们只有一个括号的差别,但是表示的意义却截然不同。函数指针的本身是一个指针,指针指向的是一个函数。指针函数的本身是一个函数,其函数的返回值是一个指针。
2. 用函数指针作为函数的返回值
在上面提到的指针函数里面,有这样一类函数,它们也返回指针型数据(地址),但是这个指针不是指向int、char之类的基本类型,而是指向函数。对于初学者,别说写出这样的函数声明,就是看到这样的写法也是一头雾水。比如,下面的语句:
int (*ff(int))(int *, int);
我们用上面介绍的方法分析一下,ff首先与后面的“()”结合,即:
int (*(ff(int)))(int *, int); // 用括号将ff(int)再括起来
也就意味着,ff是一个函数。
接着与前面的“*”结合,说明ff函数的返回值是一个指针。然后再与后面的“()”结合,也就是说,该指针指向的是一个函数。
这种写法确实让人非常难懂,以至于一些初学者产生误解,认为写出别人看不懂的代码才能显示自己水平高。而事实上恰好相反,能否写出通俗易懂的代码是衡量程序员是否优秀的标准。一般来说,用typedef关键字会使该声明更简单易懂。在前面我们已经见过:
int (*PF)(int *, int);
也就是说,PF是一个函数指针“变量”。当使用typedef声明后,则PF就成为了一个函数指针“类型”,即:
typedef int (*PF)(int *, int);
这样就定义了返回值的类型。然后,再用PF作为返回值来声明函数:
PF ff(int);
下面将以程序清单1为例,说明用函数指针作为函数的返回值的用法。当程序接收用户输入时,如果用户输入d,则求数组的最大值,如果输入x,则求数组的最小值,如果输入p,则求数组的平均值。
程序清单 1 求最值与平均值示例
1 #include<stdio.h>
2 #include <assert.h>
3 double GetMin(double *dbData, int iSize) // 求最小值
4 {
5 double dbMin;
6 int i;
7
8 assert(iSize>0);
9 dbMin=dbData[0];
10 for (i=1; i<iSize; i++){
11 if (dbMin>dbData[i]) {
12 dbMin=dbData[i];
13 }
14 }
15 return dbMin;
16 }
17
18 double GetMax(double *dbData, int iSize) // 求最大值
19 {
20 double dbMax;
21 int i;
22
23 assert(iSize>0);
24 dbMax=dbData[0];
25 for (i=1; i<iSize; i++){
26 if (dbMax< dbData[i]) {
27 dbMax=dbData[i];
28 }
29 }
30 return dbMax;
31 }
32
33 double GetAverage(double *dbData, int iSize) // 求平均值
34 {
35 double dbSum=0;
36 int i;
37
38 assert(iSize>0);
39 for (i=0; i<iSize; i++)
40 {
41 dbSum+=dbData[i];
42 }
43 return dbSum/iSize;
44 }
45
46 double UnKnown(double *dbData, int iSize) // 未知算法
47 {
48 return 0;
49 }
50
51 typedef double (*PF)(double *dbData, int iSize); // 定义函数指针类型
52 PF GetOperation(char c) // 根据字符得到操作类型,返回函数指针
53 {
54 switch (c)
55 {
56 case 'd':
57 return GetMax;
58 case 'x':
59 return GetMin;
60 case 'p':
61 return GetAverage;
62 default:
63 return UnKnown;
64 }
65 }
66
67 int main(void)
68 {
69 double dbData[]={3.1415926, 1.4142, -0.5,999, -313, 365};
70 int iSize=sizeof(dbData)/sizeof(dbData[0]);
71 char c;
72
73 printf("Please input the Operation :\n");
74 c=getchar();
75 printf("result is %lf\n", GetOperation(c)(dbData,iSize)); // 通过函数指针调用函数
76 }
上述程序中前面4个函数分别实现求最大值、最小值、平均值和未知算法,然后实现了GetOperation函数。这个函数根据字符的返回值实现上面4个函数。它是以函数指针的形式返回的,从后面的main函数的GetOperation(c)(dbData, iSize)可以看出,通过这个指针可以调用函数。
(三)深入理解void类型
1.空指针
一般来说,程序的起始地址是从“代码区”的0地址开始存放的(注:如果插入一个内存分布图,则更能说明问题,此处省略),但实际上现代操作系统并非如此,却保留了从0开始的一块内存。至于这块内存到底有有多大,与具体的操作系统有关。如果程序试图访问这块内存,则系统提示异常。
为什么操作系统不是保留一个字节呢?由于内存管理是按页来进行的,因此无法做到单独保留一个字节。尽管如此,但还是有极少数系统设定RAM区从0地址开始,但指向有效变量的指针不会指向0地址。即使“代码区”从0地址开始,但在任何情况下,0地址都不是C语言中任何函数的起始地址,因此指向有效函数地址的指针也不会指向0地址。
☛ 课外知识延伸
虽然 80C51微控制器XDATA区(外部RAM)是从0地址开始的,但只要对保存在0地址中的变量不进行取地址操作(&操作),即可有效地保证指针不会指向0地址。
与此同时,虽然32位ARM7微控制器也是从0地址开始的,但这块内存仅用于存放中断向量代码,而不是程序中的有效变量地址,因此即便用空指针来判断指针的有效性,其仍然是可行的。
基于此,于是将空指针定义为指向0地址的指针。毫无疑问,任何一种指针类型都有一个特殊的指针值,即空指针。它既不会指向任何对象或函数,也不是任何对象或函数的地址。而未初始化的指针,则完全可能指向任何地方。
由此可见,空指针与未初始化的指针是完全不同的两个概念。那么,将如何在程序中获得一个空指针呢?
2. 空指针常量与NULL
标准C规定,在初始化、赋值或比较时,如果一边是变量或指针类型的表达式,则编译器可以确定另一边的常数0为空指针,并生成正确的空指针值。即在指针上下文中“值为0的整型常量表达式”在编译时转换为空指针。
为了让程序中的空指针使用更加明确,标准C专门定义了一个标准预处理宏NULL,其值为“空指针常量”,通常为0或(void *)0,即在指针上下文中NULL与0是等价的,而未加修饰的0也是完全可以接受的。由于void *指针的特殊赋值属性,比如:
#define NULL ((void *)0)
当NULL定义为((void *)0)时,即NULL是可以赋值给任何类型指针的值,它的类型为void*,而不是整数0,因此初始化“FILE *fp = NULL;”是完全合法的。
而为了区分整数0和空指针0,当需要其它类型的0的时候,即使可能工作,但也不能使用NULL,如果这样处理其格式是错误的,这在非指针上下文中是不能工作的。特别地,不能在需要ASCII空字符(NUL)的地方使用NULL。如果确实需要,则可以自定义为:
#define NUL '\0'
由此可见,常数0是一个空指针常量,而NULL仅仅是它的一个别名。
3. 空指针的用途
一般来说,未初始化是不能使用的非法指针,因为它完全有可能指向任何地方,从而导致程序无法判断它为非法指针。因此,不管指针变量是全局的还是局部的、静态的还是非静态的,都应该在声明它的同时进行初始化,要么赋予一个有效的地址,要么赋予NULL。
标准C规定,全局指针变量的默认值为NULL,而对于局部指针变量则必须明确地指定其初值。因此,void通常用于指针变量的初始化,用来判断一个指针的有效性。比如:
unsigned char *pucBuf=(void *)0; // 定义pucBuf为unsigned char类型指针并初始化为空指针
如果后续的代码忘记初始化指针而直接使用的话,则可能造成程序失败。虽然空指针也是非法指针,但可以通过程序判断并告诉程序员代码可能有问题。也就是说,如果一开始就将指针初始化为空指针,则可避免程序异常。比如:
if(pucBuf==0){
return error; // 如果pucBuf为空指针,则返回参数错误
}
由于void类型指针的不确定性,因此它可以指向任意类型的数据,那么只要在使用时做一个简单的强制类型转换就可以了。比如:
unsignned char *pcData = NULL; // 定义pcData为unsigned char类型指针
void *pvData; // 定义pvData为void类型指针
pvData = pcData; // 无需进行强制类型转换
pcData = (unsigned char*) pvData; // 将pvData强制转换为unsigned char类型指针
显然不存在void类型的对象,也就是说,当对象为空类型时,其大小为0字节;当对象未确定类型时,那么它的大小也是未确定的,因此不能声明void类型变量。比如:
void a; // 非法声明
既然上述声明是非法的,那么,也就不能将sizeof运算符用于void类型。也就意味着,编译器不知道所指对象的大小,由于指针的算术运算总是基于所指对象的大小的,因此不允许对void指针进行算术运算。
总之,在指针声明中,void *表示通用指针的类型。如果void作为函数的返回类型,则表示不返回任何值。如果void位于参数列表中,则表示没有参数。
4. 用无类型指针作为函数参数
由于C语言中最小长度的变量为char类型(包括unsigned char、signed char等),其sizeof(char)的结果为1,而其它任何变量的长度都是它的整数倍。比如,如果使用SDCC51编译器,其sizeof(int)为2。因为通用swap函数函数不知道需要交换的变量的类型,所以需要一个参数给出相应的指示。由于C语言的变量类型多种多样,因此不可能为每一种变量类型编号,而且swap并不关心变量的真正类型,所以可以用变量的长度代替变量类型。通用swap函数的原型为:
void swap(void *pvData1, void *pvData2, int iDataSize)
将a,b两个变量(变量类型必须一样)的值交换的代码如下:
swap(&a, &b, sizeof(a));
通用swap排序函数的参考代码见程序清单1.1。
程序清单1.1 通用swap排序函数
1 void swap (void *pvData1, void *pvData2, int iDataSize)
2 {
3 unsigned char *pcData1 = NULL;
4 unsigned char *pcData2 = NULL;
5 unsigned char ucTmp1;
6
7 pcData1 = (unsigned char *)pvData1;
8 pcData2 = (unsigned char *)pvData2;
9
10 do {
11 ucTmp1 = *pcData1;
12 *pcData1 = *pcData2;
13 *pcData2 = ucTmp1;
14 pcData1++;
15 pcData2++;
16 } while (--iDataSize > 0);
17 }