天天看点

比较C语言标准I/O与*nix系统I/O的异同

   linux/unix系统的i/o也就是一般所说的低级i/o——操作系统提供的基本io服务,与os绑定,特定于*nix平台。而标准i/o是ansi c建立的一个标准i/o模型,是一个标准函数包和stdio.h头文件中的定义,具有一定的可移植性。两者一个显著的不同点在于,标准i/o默认采用了缓冲机制,比如调用fopen函数,不仅打开一个文件,而且建立了一个缓冲区(读写模式下将建立两个缓冲区),还创建了一个包含文件和缓冲区相关数据的数据结构。低级i/o一般没有采用缓冲,需要自己创建缓冲区,不过其实在*nix系统中,都是有使用称为内核缓冲的技术用于提高效率,读写调用是在内核缓冲区和进程缓冲区之间进行的数据复制。

1.fopen与open

标准i/o使用fopen函数打开一个文件:

file* fp=fopen(const char* path,const char *mod)

其中path是文件名,mod用于指定文件打开的模式的字符串,比如"r","w","w+","a"等等,可以加上字母b用以指定以二进制模式打开(对于*nix系统,只有一种文件类型,因此没有区别),如果成功打开,返回一个file文件指针,如果失败返回null,这里的文件指针并不是指向实际的文件,而是一个关于文件信息的数据包,其中包括文件使用的缓冲区信息。

*nix系统使用open函数用于打开一个文件:

int fd=open(char *name,int how);

与fopen类似,name表示文件名字符串,而how指定打开的模式:o_rdonly(只读),o_wronly(只写),o_rdwr (可读可写),还有其他模式请man 2 open。成功返回一个正整数称为文件描述符,这与标准i/o显著不同,失败的话返回-1,与标准i/o返回null也是不同的。

2.fclose与close

与打开文件相对的,标准i/o使用fclose关闭文件,将文件指针传入即可,如果成功关闭,返回0,否则返回eof

比如:

if(fclose(fp)!=0)  

  printf("error in closing file");

而*nix使用close用于关闭open打开的文件,与fclose类似,只不过当错误发生时返回的是-1,而不是eof,成功关闭同样是返回0。c语言用error code来进行错误处理的传统做法。

3.读文件,getc,fscanf,fgets和read

标准i/o中进行文件读取可以使用getc,一个字符一个字符的读取,也可以使用gets(读取标准io读入的)、fgets以字符串单位进行读取(读到遇到的第一个换行字符的后面),gets(接受一个参数,文件指针)不判断目标数组是否能够容纳读入的字符,可能导致存储溢出(不建议使用),而fgets使用三个参数:

 char * fgets(char *s, int size, file *stream);

第一个参数和gets一样,用于存储输入的地址,第二个参数为整数,表示输入字符串的最大长度,最后一个参数就是文件指针,指向要读取的文件。最后是fscanf,与scanf类似,只不过增加了一个参数用于指定操作的文件,比如fscanf(fp,"%s",words)

*nix系统中使用read函数用于读取open函数打开的文件,函数原型如下:

ssize_t numread=read(int fd,void *buf,size_t qty);

其中fd就是open返回的文件描述符,buf用于存储数据的目的缓冲区,而qty指定要读取的字节数。如果成功读取,就返回读取的字节数目(小于等于qty)。

4.判断文件结尾,如果尝试读取达到文件结尾,标准io的getc会返回特殊值eof,而fgets碰到eof会返回null,而对于*nix的read函数,情况有所不同。read读取qty指定的字节数,最终读取的数据可能没有你所要求的那么多(qty),而当读到结尾再要读的话,read函数将返回0.

5.写文件:putc,fputs,fprintf和write

与读文件相对应的,标准c语言i/o使用putc写入字符,比如:

putc(ch,fp);

第一个参数是字符,第二个是文件指针。而fputs与此类似:

fputs(buf,fp);

仅仅是第一个参数换成了字符串地址。而fprintf与printf类似,增加了一个参数用于指定写入的文件,比如:

fprintf(stdout,"hello %s.\n","dennis");

切记fscanf和fprintf将file指针作为第一个参数,而putc,fputs则是作为第二个参数。

在*nix系统中提供write函数用于写入文件,原型与read类似:

ssize_t result=write(int fd,void *buf ,size_t amt);

fd是文件描述符,buf是将要写入的内存数据,amt是要写的字节数。如果写入成功返回写入的字节数,通过result与amt的比较可以判断是否写入正常,如果写入失败返回-1。write函数仅仅是将数据写入了缓冲区,何时写入磁盘由内核决定,如果要强制写入硬盘,那么在open的时候选择o_sync选项,或者调用fsync函数

6.随机存取:fseek()、ftell()和lseek()

标准i/o使用fseek和ftell用于文件的随机存取,先看看fseek函数原型

int fseek(file *stream, long offset, int whence);

第一个参数是文件指针,第二个参数是一个long类型的偏移量(offset),表示从起始点开始移动的距离。第三个参数就是用于指定起始点的模式,stdio.h指定了下列模式常量:

seek_set            文件开始处

seek_cur            当前位置

seek_end            文件结尾处

看几个调用例子:

fseek(fp,0l,seek_set);  //找到文件的开始处

fseek(fp,0l,seek_end);  //定位到文件结尾处

fseek(fp,2l,seek_cur);  //文件当前位置向前移动2个字节数

而ftell函数用于返回文件的当前位置,返回类型是一个long类型,比如下面的调用:

fseek(fp,0l,seek_end);//定位到结尾

long last=ftell(fp);  //返回当前位置

那么此时的last就是文件指针fp指向的文件的字节数。

与标准i/o类似,*nix系统提供了lseek来完成fseek的功能,原型如下:

off_t lseek(int fildes, off_t offset, int whence);

fildes是文件描述符,而offset也是偏移量,whence同样是指定起始点模式,唯一的不同是lseek有返回值,如果成功就返回指针变化前的位置,否则返回-1。因此可以通过下列方法模拟ftell函数来返回当前偏移量:

off_t    currpos;

currpos = lseek(fd, 0, seek_cur);

whence的取值与fseek相同:seek_set,seek_cur,seek_end,但也可以用整数0,1,2相应代替。

最后,以一个例子结尾,通过c语言编写linux系统的cp指令,先看看使用标准i/o版本的:

#include<stdio.h>

#include<stdlib.h>

void oops(char *,char *);

int main(int ac,char *av[])

{

  file *in,*out;

  int ch;

  if(ac!=3){

   fprintf(stderr,"useage:%s source-file target-file.\n",av[0]);

   exit(1);

  }

  if((in=fopen(av[1],"r"))==null)

   oops("can not open ",av[1]);

  if((out=fopen(av[2],"w"))==null)

   oops("can not open ",av[2]);

  while((ch=getc(in))!=eof)

    putc(ch,out);

  if(fclose(in)!=0||fclose(out)!=0)

    oops("can not close files.\n"," ");

  return 0;

}

void oops(char *s1,char* s2)

  fprintf(stderr,"error:%s %s\n",s1,s2);

  exit(1);

再看一个使用unix io的版本:

#include<unistd.h>

#include<fcntl.h>

#define buffersize 4096

#define copymode 0644

  int in_fd,out_fd,n_chars;

  char buf[buffersize];

    fprintf(stderr,"useage:%s source-file target-file.\n",av[0]);

    exit(1);

  if((in_fd=open(av[1],o_rdonly))==-1)

     oops("can't open ",av[1]);

  if((out_fd=creat(av[2],copymode))==-1)

    oops("can't open ",av[2]);

  while((n_chars=read(in_fd,buf,buffersize))>0)

      if(write(out_fd,buf,n_chars)!=n_chars)

           oops("write error to ",av[2]);

  if(n_chars==-1)

      oops("read error from ",av[1]);

  if(close(in_fd)==-1||close(out_fd)==-1)

    oops("error closing files","");

void oops(char *s1,char *s2)

  fprintf(stderr,"error:%s",s1);

  perror(s2);

显然,在使用unix i/o的时候,你要更多地关注缓冲问题以提高效率,而stdio则不需要考虑。

文章转自庄周梦蝶  ,原文发布时间2007-08-22<b></b>

继续阅读