EOF是 End Of File 的縮寫。在C語言中,它是在標准庫中定義的一個宏。
(1) 判斷文件結束
多數人認為文件中有一個EOF,用於表示文件的結尾. 但這個觀點實際上是錯誤的,在文件所包含的數據中,並沒有什麼文件結束符. 對getc 而言, 如果不能從文件中讀取,則返回一個整數 -1,這就是所謂的EOF. 返回 EOF 無非是出現了兩種情況,一是文件已經讀完; 二是文件讀取出錯,反正是讀不下去了.
文件結束符EOF,Windows下為組合鍵Ctrl+Z,Unix/Linux下為組合鍵Ctrl+D
在linux中ctrl+c是程序結束命令就是向程序發送kill消息
一、getchar的兩點總結:
1.當你輸入一些有效數據時,最後加上enter鍵或ctrl+D鍵getchar才會從鍵盤緩沖區中讀取數值。如下面程序段:
while((c=getchar())!=EOF){ putchar(c); }
若是按enter鍵結束的,最後會打印出enter鍵當然此鍵是不可見的,並等待下次的輸入。
若是按ctrl+D結束的,直接打印有效數據,並等待下次輸入。
當你沒有輸入有效數據按下enter鍵會直接打印出enter鍵(當然這個鍵是不可見的),並再次等待下次的輸入,直接按下ctrl+D鍵時,程序執行下面的程序代碼,不在等待輸入。
2.getchar()的返回值一般情況下是字符,但也可能是負值,即返回EOF。
這裡要強調的一點就是,getchar函數通常返回終端所輸入的字符,這些字符系統中對應的ASCII值都是非負的。因此,很多時候,我們會寫這樣的兩行代碼:
charc; c=getchar();
這樣就很有可能出現問題。因為getchar函數除了返回終端輸入的字符外,在遇到Ctrl+D(Linux下)即文件結束符EOF時,getchar()的返回EOF,這個EOF在函數庫裡一般定義為-1。因此,在這種情況下,getchar函數返回一個負值,把一個負值賦給一個char型的變量是不正確的。為了能夠讓所定義的變量能夠包含getchar函數返回的所有可能的值,正確的定義方法如下(K&R C中特別提到了這個問題):
intc; c=getchar();
二、EOF的兩點總結(主要指普通終端中的EOF)
1.EOF作為文件結束符時的情況:
EOF雖然是文件結束符,但並不是在任何情況下輸入Ctrl+D(Windows下Ctrl+Z)都能夠實現文件結束的功能,只有在下列的條件下,才作為文件結束符。
(1)遇到getcahr函數執行時,輸入第一個字符時就直接輸入Ctrl+D,就可以跳出getchar(),去執行程序的其他部分;
(2)在前面輸入的字符為換行符時,接著輸入Ctrl+D;
(3)在前面有字符輸入且不為換行符時,要連著輸入兩次Ctrl+D,這時第二次輸入的Ctrl+D起到文件結束符的功能,第一次的Ctrl+D使getchar開始讀取鍵盤緩沖區中的數據。
其實,這三種情況都可以總結為只有在getchar()提示新的一次輸入時,直接輸入Ctrl+D才相當於文件結束符。
2.EOF作為行結束符時的情況,這時候輸入Ctrl+D並不能結束getchar(),而只能引發getchar()提示下一輪的輸入。
這種情況主要是在進行getchar()新的一行輸入時,當輸入了若干字符(不能包含換行符)之後,直接輸入Ctrl+D,此時的Ctrl+D並不是文件結束符,而只是相當於換行符的功能,即結束當前的輸入。以上面的代碼段為例,如果執行時輸入abc,然後Ctrl+D,程序輸出結果為:
abcabc
注意:第一組abc為從終端輸入的,然後輸入Ctrl+D,就輸出第二組abc,同時光標停在第二組字符的c後面,然後可以進行新一次的輸入。這時如果再次輸入Ctrl+D,則起到了文件結束符的作用,結束getchar()。
如果輸入abc之後,然後回車,輸入換行符的話,則終端顯示為:
abc//第一行,帶回車
abc//第二行
//第三行
其中第一行為終端輸入,第二行為終端輸出,光標停在了第三行處,等待新一次的終端輸入。
從這裡也可以看出Ctrl+D和換行符分別作為行結束符時,輸出的不同結果。
EOF的作用也可以總結為:當終端有字符輸入時,Ctrl+D產生的EOF相當於結束本行的輸入,將引起getchar()新一輪的輸入;當終端沒有字符輸入或者可以說當getchar()讀取新的一次輸入時,輸入Ctrl+D,此時產生的EOF相當於文件結束符,程序將結束getchar()的執行。
【補充】本文第二部分中關於EOF的總結部分,適用於終端驅動處於一次一行的模式下。也就是雖然getchar()和putchar()確實是按照每次一個字符 進行的。但是終端驅動處於一次一行的模式,它的輸入只有到"\n"或者EOF時才結束,因此,終端上得到的輸出也都是按行的。
如果要實現終端在讀一個字符就結束輸入的話,下面的程序是一種實現的方法(參考《C專家編程》,略有改動)
#include<stdio.h> #include<stdlib.h> int main(void) { intc; /*終端驅動處於普通的一次一行模式 */ system("sttyraw"); /*現在的終端驅動處於一次一個字符模式 */ c=getchar(); putchar(); /*終端驅動處又回到一次一行模式 */ system("sttycooked"); return0; }
編譯運行該程序,則當如入一個字符時,直接出處一個字符,然後程序結束。
由此可見,由於終端驅動的模式不同,造成了getchar()輸入結束的條件不一樣。普通模式下需要回車或者EOF,而在一次一個字符的模式下,則輸入一個字符之後就結束了。
總結:EOF並不是存在於文件中的,而是一種狀態,當讀到文件末尾或者讀取出錯時就會返回這個值來判斷文件結束。(即即使讀取錯誤可能也被認為文件結束,所以就需要用feof 和 ferror來判斷是不是真的文件結束了)
當用getchar(c)時,即使c定義成字符型,也可以結束,主要是c與-1比較時,c也會從char轉換為整型值。
寫個小程序驗證了一下
#include <stdio.h> nt main() { char c; c = -1; printf("%x",c); return 0; }
得到的結果為ffffffff,所以c即使定義為char型,讀取文件等時還是能正常結束。