1、首先來看一個例子:
#include <stdio.h>
int main( )
{
int c;
c = getchar();
while (c != EOF){
putchar();
c= getchar();
}
return 0;
}
這裡主要解釋下為什麼要用int型來接受getchar函數。
很多時候,我們會寫這樣的兩行代碼:
char c;
c = getchar();
這樣就很有可能出現問題。因為getchar函數除了傳回終端輸入的字元外,在遇到Ctrl+D即檔案結束符EOF時,getchar ()傳回EOF。但這個EOF在函數庫裡一般定義為-1。是以,在這種情況下,getchar函數傳回一個負值,把一個負值賦給一個char型的變量是不正确的。
2、getchar如何擷取字元和輸出字元的。
#include "stdio.h"
main()
{
char c,d,e,f;
printf("please input two characters:\n");
c=getchar();
putchar(c);
putchar('\n');
d=getchar();
putchar(d);
putchar('\n');
e=getchar();
putchar(e);
putchar('\n');
f=getchar();
putchar(f);
putchar('\n');
printf("c= %c\n",c);
printf("d= %c\n",d);
printf("e= %c\n",e);
printf("f= %c\n",f);
}
運作後先輸入“12”,回車,再輸入“34”,回車。
運作環境是redhat gcc
運作結果:
$: please input two characters:
12
1
2
34
3
c=1
d=2
e=
f=3
下面具體解釋一下:
getchar函數每次從緩沖區中得到一個字元(包括換行符),putchar函數每次輸出一個字元(包括換行符)。
首先輸入了兩個字元’1’和’2’,然後回車。注意這時寫入緩存中的有3個字元:‘1’、‘2’、’\n’。
程式中有四個getchar(),于是c=‘1’,d=‘2’,e=’\n’。
這時運作到f=getchar();輸入緩存中的三個字元均被前三個getchar擷取,這時需要使用者輸入,
這裡輸入了34
于是f=‘3’,‘4’ 和後面的 ‘\n’ 沒有被利用。
這便是整個流程。
- 這裡我們要注意下面幾條:
- 用getchar讀入時,如果不按回車符,所有輸入會放入緩沖區而不會被讀入。是以執行c=getchar();時,我們輸入12,如果不按Enter鍵,1仍然不會讀入;
- 最後按下的Enter鍵,雖是用來告訴系統輸入已結束,但同時也會作為一個字元放入緩沖區,是以我們輸入12按回車後,輸入流其實有三個字元:1、2、回車,而這個回車就被e讀取了;
- 12是被當做兩個字元’1’和’2’(注意,不是數字1、2),而不像%d時,作為一個數字12來看待;
- putchar()輸出指定字元,不會在輸出後自動換行,是以putchar©;和putchar(d);之間要加putchar(’\n’);如果不加的話,會把c和d兩個自動(1、2)輸入到同一行。
- getchar可以讀入所有字元。
- windows下如果想結束,就輸入Ctrl+Z,表示EOF,Linux下輸入Ctrl+ D。
- 大師級經典的著作,要字斟句酌的去讀,去了解。以前在看K&R的The C Programming Language(Second Edition)中第1.5節的字元輸入/輸出,很迷惑getchar()和EOF的行為。是以,感覺很有必要總結一下,不然,很多瑣碎的知識點長時間過後就會淡忘的,隻有寫下來才是最好的方法。
- scanf和getchar的混用
- 假設程式要求用getchar()處理字元輸入,用scanf()處理數值輸入,這兩個函數都能很好的完成任務,但是不能混合使用。 因為getchar()讀取每個字元,包括空格、制表符和換行符;而scanf()在讀取數字時則會跳過空格、制表符和換行符。
- 例如:要求使用者輸入一個字母和兩個數字,輸出以第一個數字為行數,第二個數字為列數,以字母為内容的數列,要求可以不斷輸入直至鍵入回車退出程式:
#include <stdio.h>
void display(char cr,int lines,int width);
int main(int argc, const char * argv[]) {
int ch;
int rows,cols;
printf("Enter a character and two integers:\n");
while((ch=getchar())!= '\n'){
scanf("%d %d", &rows,&cols);
display(ch, rows, cols);
printf("Enter another character and two integers;\n");
printf("Enter a newline to quit.\n");
}
printf("Bye.\n");
return 0;
}
void display(char cr,int lines,int width){
int row,col;
for(row=1; row<= lines; row++){
for(col =1; col<=width; col++){
putchar(cr);
}
putchar('\n');
}
}
- 發現,再輸入"c23",成功列印一次後,程式就自動退出了。這明顯不符合我們的題目要求。
- 原因是:輸入的c23其實是c23+換行符,scanf()函數把這個換行符留在了緩存中。getchar()不會跳過換行符,是以在進入下一輪疊代時,還沒來得及輸入字元,它就讀取了換行符,然後将其指派給了ch。而ch是換行符正式終止循環的條件。是以,我們需要删除scanf()函數留在緩存中的換行符。
- 改進方法:
- 在if語句中使用一個break語句,可以在scanf()的傳回值不等于2時終止程式,即如果一個或兩個輸入值不是整數或者遇到檔案結尾就終止程式。
- 在scanf()後面,添加一個吞噬無用字元的while循環
#include <stdio.h>
void display(char cr,int lines,int width);
int main(int argc, const char * argv[]) {
int ch;
int rows,cols;
printf("Enter a character and two integers:\n");
while((ch=getchar())!= '\n'){
if( scanf("%d %d", &rows,&cols)!=2 ){
break;
}
display(ch, rows, cols);
while(getchar()!='\n'){
continue;
}
printf("Enter another character and two integers;\n");
printf("Enter a newline to quit.\n");
}
printf("Bye.\n");
return 0;
}
void display(char cr,int lines,int width){
int row,col;
for(row=1; row<= lines; row++){
for(col =1; col<=width; col++){
putchar(cr);
}
putchar('\n');
}
}
3、總結
3.1 對getchar的兩點總結
- getchar是以行為機關進行存取的。
- 當調用getchar函數讀取輸入時,隻有當輸入字元為換行符’/n’或檔案結束符EOF時,getchar才會停止執行,整個程式将會往下執行。并且,如果輸入行是以EOF結束的(EOF之前不是換行符),則EOF會被“吃掉”(即不會被getchar 讀取到)。譬如下面程式段:
while((c = getchar()) != EOF){
putchar(c);
}
- 執行程式,輸入:abc,然後回車。則程式就會去執行puchar©,然後輸出abc 和一個回車。然後可以繼續輸入,再次遇到換行符的時候,程式又會把那一行的輸入的字元輸出在終端上。
- 令人迷惑的是,getchar不是以字元為機關讀取的嗎?那麼,既然我輸入了第一個字元a,肯定滿足while循環(c = getchar()) != EOF 的條件,那麼應該執行putchar©在終端輸出一個字元a。但是程式就偏偏不這樣執行,而是必需讀到一個換行符或者檔案結束符EOF才進行一次輸出。
- 造成這種結果的一種解釋是,輸入終端驅動處于一次一行的模式下。也就是雖然getchar()和putchar()确實是按照每次一個字元進行的。但是終端驅動處于一次一行的模式,它的輸入隻有到’/n’或者EOF時才結束。
- 在本例中,程式段調用了getchar函數,則控制權從程式段轉移到getchar函數,而getchar函數要依賴于作業系統的驅動來讀取輸入,沒遇到換行符或者EOF,驅動不會通知getchar函數,getchar函數處于“阻塞”狀态。而遇到換行符或者EOF 後, getchar函數解除“阻塞”,讀取一個字元,控制權傳回程式段,執行putchar 函數,循環執行。直到遇到EOF字元或者這行輸入全部處理完。
- getchar()的傳回值必須用int定義。一般情況下傳回值是非負值,但也可能是負值,即傳回EOF。這個EOF在函數庫裡一般定義為-1。正确的定義方法如下(K&R C中特别提到了這個問題):
int c;
c = getchar();
3.2 EOF的兩點總結(主要指普通終端中的EOF)
- EOF作為檔案結束符時的情況:
- EOF雖然是檔案結束符,但并不是在任何情況下輸入Ctrl+D(Windows下Ctrl+Z)都能夠實作檔案結束的功能,隻有在下列的條件下,才作為檔案結束符:
- (1)遇到getcahr函數執行時,要輸入第一個字元時就直接輸入Ctrl+D;
- (2)在前面輸入的字元為換行符時,接着輸入Ctrl+D;
- (3)在前面有字元輸入且不為換行符時,要連着輸入兩次Ctrl+D,這時第二次輸入的Ctrl+D起到檔案結束符的功能,至于第一次的Ctrl+D作為行結束符(如1.1所講)。
其實,這三種情況都可以總結為:隻有在getchar()提示新的一次輸入時,直接輸入Ctrl+D才相當于檔案結束符。
- EOF作為行結束符時的情況
- 這時候輸入Ctrl+D作為行結束的标志能結束getchar()的“阻塞”,使getchar()逐個字元讀入,但是EOF會被“吃掉”,并不會被讀取。
- 以上面的代碼段為例,如果執行時輸入abc,然後Ctrl+D,程式輸出結果為: abcabc
注意:第一組abc是你從終端輸入的,然後輸入Ctrl+D,getchar逐個字元讀取并逐個輸出列印出第二組abc,同時光标停在第二組字元的c後面,然後可以進行新一次的輸入。這時如果再次輸入Ctrl+D,就會起到了檔案結束符的作用,因為EOF是一行輸入的第一個字元。如果輸入abc之後,然後回車,輸入換行符的話,則終端顯示為:
abc'/n'
abc'/n'
//第三行
其中第一行為你是終端輸入的,第二行是終端輸出(含換行符),光标停在了第三行處,等待新一次的終端輸入。從這裡也可以看出Ctrl+D和換行符分别作為行結束符時,輸出的不同結果。
3.3 scanf()
- scanf()在讀取數字時會自動跳過緩存區中的前導空格、制表符和換行符。即當輸入格式是%d時,scanf會忽略任何空白字元(空格、回車、制表符等),忽略的意思是,從緩沖區裡删除,但并不儲存;如果遇到數字,則拿出并儲存給後面的整數,也就是說%d的時候,scanf想要的字元是數字和空白符。但如果格式是%c,那麼任何字元都是它想要的,包括空格、回車、制表符等。
- 例如: 參考文獻:C語言 getchar()原理及易錯點解析