C++編程語言中的很多功能在我們的實際應用中起著非常大的作用。比如在對文件文本的操作上,就可以用多種方式來實現。在這裡我們介紹的C++ eof()函數就是其中一個比較常用的基本函數。
在使用C/C++讀文件的時候,一定都使用過C++ eof()函數來判斷文件是否為空或者是否讀到文件結尾了,也會在使用這個函數的過程中遇到一些問題,如不能准確的判斷是否為空或者是否到了文件尾,以至於有些人可能還會懷疑這個函數是不是本身在設計上就有問題。
先來看看如下這段代碼:
- #include < iostream>
- #include < fstream>
- using namespace std;
- int main()
- {
- char ch = 'x';
- ifstream fin("test.txt" /*, ios::binary*/);
- if (fin.eof())
- {
- cout < < "file is empty."< < endl;
- return 0;
- }
- while (!fin.eof())
- {
- fin.get(ch);
- cout < < ch;
- }
- system("pause");
- return 0;
- }
編譯並運行以上代碼,
如果test.txt不存在,程序會形成死循環,fin.eof()永遠返回false,如果test.txt為空,程序打印出一個x字符,當test.txt中存在一字符串“abcd”且沒有換行時,程序打印出“abcdd”,當存在以上字符串並且有一新的空行時,程序打印出“abcd”加上一空行。
這種現象可能讓很多人很迷惑,程序運行的結果似乎很不穩定,時對時錯。使用binary模式讀時結果一樣。在這裡,大家可能有一個誤區,認為eof)返回true時是讀到文件的最後一個字符,其實不然,C++ eof()函數返回true時是讀到文件結束符0xFF,而文件結束符是最後一個字符的下一個字符。
因此,當讀到最後一個字符時,程序會多讀一次編譯器會讓指針停留在最後一個字符那裡,然後重復讀取一次,這也就是就上面最後一個字符會輸出兩次的原因。至於是不是所有的編譯器都這樣處理我就不太清楚了,我使用的VC6,VC8似乎都是這樣的)
問題出來了,就要找出對應的解決之道,要解決以上的問題,只需要調整一下條件語句即可:
- fin.peek() == EOF 或 fin.get(ch)
再來看一下另外一種情況:
- #include < iostream>
- #include < fstream>
- #include < string>
- using namespace std;
- int main()
- {
- string str;
- ifstream fin("test.txt"/*, ios::binary*/);
- if (fin.peek() == EOF)
- {
- cout < < "file is empty."< < endl;
- return 0;
- }
- while (!fin.eof())
- {
- fin >> str;
- cout < < str;
- }
- system("pause");
- return 0;
- }
上述代碼在VC8下編譯運行,發現,當文件結尾沒有空行時,結果正確,當結尾有空行時,最後一個字符串將被重復輸出一次, 而VC6的情況則有所不同,沒有重復輸出,但輸出了一個空行。
因此,為了保證在不同的編譯器下得到一致的我們期望的結果,將條件語句做一下修改:
- fin >> str
綜上對C++ eof()函數的描述,我們可以得到以下結論:
1. 判斷文件是否為空時使用peek函數,若peek返回EOF則文件為空;
2. 讀取文件過程中,讀取非char型時,使用peek判斷文件尾將不再適用,循環判斷條件應改用>>操作符進行讀取,若讀入char型緩沖區,peek函數會表現得很好。