解剖getchar和putchar
一、首先來看一個例子:
#include <stdio.h>
int main( )
{
int c;
c = getchar();
while (c != EOF)
{
putchar();
c= getchar();
}
return 0;
}
這裡主要解釋下為什麼要用int型來接受getchar函式。
很多時候,我們會寫這樣的兩行程式碼:
char c;
c = getchar();
這樣就很有可能出現問題。因為getchar函式除了返回終端輸入的字元外,在遇到Ctrl+D即檔案結束符EOF時,getchar ()的返回EOF,這個EOF在函式庫裡一般定義為-1。因此,在這種情況下,getchar函式返回一個負值,把一個負值賦給一個char型的變數是不正確的。
二、下面用一個題目來看其實如何獲取字元和輸出字元的。
#include "stdio.h"
main()
{
char c,d,e,f;
printf("please input two characters:\n");
c=getchar();
putchar(c);
putchar('\n');
d=getchar();
putchar(d);
putchar('\n');
e=getchar();
putchar(e);
putchar('\n');
f=getchar();
putchar(f);
putchar('\n');
printf("c= %c\n",c);
printf("d= %c\n",d);
printf("e= %c\n",e);
printf("f= %c\n",f);
}
執行後先輸入“12”,回車,再輸入“34”,回車。
執行環境是redhat gcc
執行結果:
$: please input two characters:
12
1
2
34
3
c=1
d=2
e=
f=3
下面具體解釋一下:
getchar函式每次從緩衝區中得到一個字元(包括換行符),putchar函式每次輸出一個字元(包括換行符)。
首先輸入了兩個字元12,然後回車,注意這時寫入快取中的有3個字元1,2,回車。
程式中有四個getchar(),於是c='1',d='2',e='\n'。
這時執行到f=getchar();輸入快取中的三個字元均被前三個getchar獲取,這時需要使用者輸入,
這裡輸入了34
於是f='3',4和後面的回車沒有被利用。
這便是整個流程。
這裡我們要注意下面幾條:
1)用getchar讀入時,如果不按回車符,所有輸入會放入緩衝區,而不會被讀入,所以執
行c=getchar();時,我們輸入12,如果不按回車鍵,1仍然不會讀入;
2)最後按下的回車鍵,雖是用來告訴系統輸入已結束,但同時也會作為一個字元放入緩衝
區,所以我們輸入12,按回車後,輸入流其實有三個字元:1、2、回車,而這個回車就被e讀取了;
3) 12是被當做兩個字元1和2(注意,不是數字1、2),而不像%d時,作為一個數字12
來看待;
4) putchar()輸出指定字元,不會在輸出後自動換行,所以putchar(c);和putchar(d);之間要加
putchar('\n');如果不加的話,會把c和d兩個自動(1、2)輸入到同一行。
5)getchar可以讀入所有字元。
6)windows下如果想結束,就輸入Ctrl+Z,表示EOF。
師級經典的著作,要字斟句酌的去讀,去理解。以前在看K&R的The C Programming Language(Second Edition)中第1.5節的字元輸入/輸出,很迷惑getchar()和EOF的行為。因此,感覺很有必要總結一下,不然,很多瑣碎的知識點長時間過後就會淡忘的,只有寫下來才是最好的方法。
一、對getchar的兩點總結:
1. getchar是以行為單位進行存取的。
當呼叫getchar函式讀取輸入時,只有當輸入字元為換行符'/n'或檔案結束符EOF時,getchar才會停止執行,整個程式將會往下執行。並且,如果輸入行是以EOF結束的(EOF之前不是換行符),則EOF會被“吃掉”(即不會被getchar 讀取到)。譬如下面程式段:
while((c = getchar()) != EOF){
putchar(c);
}
執行程式,輸入:abc,然後回車。則程式就會去執行puchar(c),然後輸出abc 和一個回車。然後可以繼續輸入,再次遇到換行符的時候,程式又會把那一行的
輸入的字元輸出在終端上。令人迷惑的是,getchar不是以字元為單位讀取的嗎?那麼,既然我輸入了第一個字元a,肯定滿足while迴圈(c = getchar()) != EOF 的條件,那麼應該執行putchar(c)在終端輸出一個字元a。但是程式就偏偏不這樣執行,而是必需讀到一個換行符或者檔案結束符EOF才進行一次輸出。
造成這種結果的一種解釋是,輸入終端驅動處於一次一行的模式下。也就是雖然getchar()和putchar()確實是按照每次一個字元進行的。但是終端驅動處於一次一行的模式,它的輸入只有到'/n'或者EOF時才結束。在本例中,程式段呼叫了getchar函式,則控制權從程式段轉移到getchar函式,而getchar函式要依賴於作業系統的驅動來讀取輸入,沒遇到換行符或者EOF,驅動不會通知getchar函式,getchar函式處於“阻塞”狀態。而遇到換行符或者EOF 後, getchar函式解除“阻塞”,讀取一個字元,控制權返回程式段,執行putchar 函式,迴圈執行。直到遇到EOF字元或者這行輸入全部處理完。
2. getchar()的返回值一般情況下是非負值,但也可能是負值,即返回EOF。這個EOF在函式庫裡一般定義為-1。正確的定義方法如下(K&R C中特別提到了這個問題):
int c;
c = getchar();
二、EOF的兩點總結(主要指普通終端中的EOF)
1. EOF作為檔案結束符時的情況:
EOF雖然是檔案結束符,但並不是在任何情況下輸入Ctrl+D(Windows下Ctrl+Z)都能夠實現檔案結束的功能,只有在下列的條件下,才作為檔案結束符。
(1)遇到getcahr函式執行時,要輸入第一個字元時就直接輸入Ctrl+D;
(2)在前面輸入的字元為換行符時,接著輸入Ctrl+D;
(3)在前面有字元輸入且不為換行符時,要連著輸入兩次Ctrl+D,這時第二次輸入的Ctrl+D起到檔案結束符的功能,至於第一次的
Ctrl+D作為行結束符(如1.1所講)。
其實,這三種情況都可以總結為只有在getchar()提示新的一次輸入時,直接輸入Ctrl+D才相當於檔案結束符。
2. EOF作為行結束符時的情況,這時候輸入Ctrl+D作為行結束的標誌能結束getchar()的“阻塞”,使getchar()逐個字元讀入,但是EOF會被“吃掉”,並不會被讀取。
以上面的程式碼段為例,如果執行時輸入abc,然後Ctrl+D,程式輸出結果為: abcabc
注意:第一組abc是你從終端輸入的,然後輸入Ctrl+D,getchar逐個字元讀取並逐個輸出打印出第二組abc,同時游標停在第二組字元的c後面,然後可以進行新一次的輸入。這時如果再次輸入Ctrl+D,就會起到了檔案結束符的作用,因為EOF是一行輸入的第一個字元。如果輸入abc之後,然後回車,輸入換行符的話,則終端顯示為:
abc'/n'
abc'/n'
//第三行
其中第一行為你是終端輸入的,第二行是終端輸出(含換行符),游標停在了第三行處,等待新一次的終端輸入。從這裡也可以看出Ctrl+D和換行符分別作為行結束符時,輸出的不同結果。