天天看點

getchar()和EOF總結(轉)

大師級經典的著作,要字斟句酌的去讀,去了解。以前在看K&R的The C Programming Language(SecondEdition)       第1.5節的字元輸入/輸出,被getchar()和EOF所迷惑了。可能主要還是由于沒有搞清楚getchar()的工作原理和EOF的用法。是以,感覺很有必要總結一下,不然,很多瑣碎的知識點長時間過後就會淡忘的,隻有寫下來才是最好的方法。

     其實,getchar()最典型的程式也就幾行代碼而已。本人所用的環境是DebianGNU/Linux,在其他系統下也一樣。

一、getchar的兩點總結:

1.getchar是以行為機關進行存取的。

當 用getchar進行輸入時,如果輸入的第一個字元為有效字元,那麼隻有當最後一個輸入字元為換行符'/n'(也可以是檔案結束符EOF,Windows下為組合鍵Ctrl+Z,Unix/Linux 下為組合鍵Ctrl+D,EOF将在後面讨論)時,getchar才會停止執 行,整個程式将會往下執行。譬如下面程式段:

while ( ( c = getchar ( ) ) ! = EOF ) { 
    putchar ( c) ; 
}
           

      執行程式,輸入:abc,然後回車。則程式就會去執行puchar(c),然後輸出abc,這個地方不要忘了,系統輸出的還有一個回車。然後可以繼續輸入,再次遇到換行符的時候,程式又會把那一行的輸入的字元輸出在終端上。

       對 于getchar,肯定很多初學的朋友會問,getchar不是以字元為機關讀取的嗎?那麼,既然我輸入了第一個字元a,肯定滿足while循環(c = getchar()) != EOF的條件阿,那麼應該執行putchar(c)在終端輸出一個字元a。不錯,我在用getchar的時候也是一直這麼想的,但是程式就偏偏不着樣執 行,而是必需讀到一個換行符或者檔案結束符EOF才進行一次輸出。

       對這個問題的一個解釋是,在大師編寫C的時候,當時并沒有所謂終端輸入 的概念,所有的輸入實際上都是按照檔案進行讀取的,檔案中一般都是以行為機關的。是以,隻有遇到換行符,那麼程式會認為輸入結束,然後采取執行程式的其他 部分。同時,輸入是按照檔案的方式存取的,那麼要結束一個檔案的輸入就需用到EOF(Enf Of File). 這也就是為什麼getchar結束輸入退出時要用EOF的原因。

2.getchar()的傳回值一般情況下是字元,但也可能是負值,即傳回EOF。

       這裡要強調的一點就是,getchar函數通常傳回終端所輸入的字元,這些字元系統中對應的ASCII值都是非負的。是以,很多時候,我們會寫這樣的兩行代碼:

char c; 
c = getchar ( ) ;
           

        這 樣就很有可能出現問題。因為getchar函數除了傳回終端輸入的字元外,在遇到Ctrl+D(Linux下)即檔案結束符EOF時,getchar() 的傳回EOF,這個EOF在函數庫裡一般定義為-1。是以,在這種情況下,getchar函數傳回一個負值,把一個負值賦給一個char型的變量是不正确 的。為了能夠讓所定義的變量能夠包含getchar函數傳回的所有可能的值,正确的定義方法如下(K&R C中特别提到了這個問題):

int c; 
c = getchar ( ) ;
           

二、EOF的兩點總結(主要指普通終端中的EOF)

1.EOF作為檔案結束符時的情況:

        EOF雖然是檔案結束符,但并不是在任何情況下輸入Ctrl+D(Windows下Ctrl+Z)都能夠實作檔案結束的功能,隻有在下列的條件下,才作為檔案結束符。

(1)遇到getchar函數執行時,要輸入第一個字元時就直接輸入Ctrl+D,就可以跳出getchar(),去執行程式的其他部分;

(2)在前面輸入的字元為換行符時,接着輸入Ctrl+D;

(3)在前面有字元輸入且不為換行符時,要連着輸入兩次Ctrl+D,這時第二次輸入的Ctrl+D起到檔案結束符的功能,至于第一次的Ctrl+D的作用将在下面介紹。

       其實,這三種情況都可以總結為隻有在getchar()提示新的一次輸入時,直接輸入Ctrl+D才相當于檔案結束符。

2.EOF作為行結束符時的情況,這時候輸入Ctrl+D并不能結束getchar(),而隻能引發getchar()提示下一輪的輸入。

      這 種情況主要是在進行getchar()新的一行輸入時,當輸入了若幹字元(不能包含換行符)之後,直接輸入Ctrl+D,此時的Ctrl+D并不是檔案結 束符,而隻是相當于換行符的功能,即結束目前的輸入。以上面的代碼段為例,如果執行時輸入abc,然後Ctrl+D,程式輸出結果為:abcabc 

注意:

第一組abc為從終端輸入的,然後輸入Ctrl+D,就輸出第二組abc,同時光标停在第二組字元的c後面,然後可以進行新一次的輸入。這時如果再次輸入Ctrl+D,則起到了檔案結束符的作用,結束getchar()。

如果輸入abc之後,然後回車,輸入換行符的話,則終端顯示為:

abc         //第一行,帶回車 

abc         //第二行 

               //第三行 

其中第一行為終端輸入,第二行為終端輸出,光标停在了第三行處,等待新一次的終端輸入。

從這裡也可以看出Ctrl+D和換行符分别作為行結束符時,輸出的不同結果。

EOF 的作用也可以總結為:當終端有字元輸入時,Ctrl+D産生的EOF相當于結束本行的輸入,将引起getchar()新一輪的輸入;當終端沒有字元輸入或 者可以說當getchar()讀取新的一次輸入時,輸入Ctrl+D,此時産生的EOF相當于檔案結束符,程式将結束getchar()的執行。

【補充】本文第二部分中關于EOF的總結部分,适用于終端驅動處于一次一行的模式下。也就是雖然getchar()和putchar()确實是按照每次一個字元 進行的。但是終端驅動處于一次一行的模式,它的輸入隻有到“/n”或者EOF時才結束,是以,終端上得到的輸出也都是按行的。

如果要實作終端在讀一個字元就結束輸入的話,下面的程式是一種實作的方法(參考《C專家程式設計》,略有改動)

/*Edit by Godbach
  CU Blog: http://blog.chinaunix.net/u/33048/ 
*/ 
# include < stdio. h> 
# include < stdlib. h> 

int 
main( void ) 
{ 
    int c; 
    /* 終端驅動處于普通的一次一行模式 */
    system ( "stty raw" ) ; 
    
    /* 現在的終端驅動處于一次一個字元模式 */ 
    c = getchar ( ) ;
    putchar ( ) ;
    
    /* 終端驅動處又回到一次一行模式 */
     system("stty cooked");
    
    return 0;
}
           

 編譯運作該程式,則當如入一個字元時,直接出處一個字元,然後程式結束。

由此可見,由于終端驅動的模式不同,造成了getchar()輸入結束的條件不一樣。普通模式下需要回車或者EOF,而在一次一個字元的模式下,則輸入一個字元之後就結束了。