許多初學者都習慣用 char 型變量接收 getchar、getc,fgetc 等函數的返 回值,其實這麼做是不對的,並且隱含著足以致命的錯誤。getchar 等函數的返 回值類型都是 int 型,當這些函數讀取出錯或者讀完文件後,會返回 EOF.EOF 是一個宏,標准規定它的值必須是一個 int 型的負數常量。通常編譯器都會把 EOF 定義為 -1.問題就出在這裡,使用 char 型變量接收 getchar 等函數的返 回值會導致對 EOF 的辨認出錯,或者錯把好的數據誤認為是 EOF,或者把 EOF 誤認為是好的數據。例如:
int c; /* 正確。應該使用 int 型 變量接收 fgetc 的返回值 */
while ( (c = fgetc(fp)) != EOF )
{
putchar(c);
}
如上例所示,我們很多時候都需 要先用一個變量接收 fgetc 等函數的返回值,然後再用這個變量和 EOF 比較, 判斷是否已經讀完文件。上面這個例子是正確的,把 c 定義為 int 型保證了它 能正確接收 fgetc 返回的 EOF,從而保證了這個比較的正確性。但是,如果把 c 定義為 char 型,則會導致意想不到的後果。
首先,因為 fgetc 等函 數的返回值是 int 型的,當賦值給 char 型變量時,會發生降級,從而導致數 據截斷。例如:
---------------------------------
| 十進制 | int | char |
|--------|--------------|--- ----|
| 10 | 00 00 00 0A | 0A |
| -1 | FF FF FF FF | FF |
| -2 | FF FF FF FE | FE |
---------------------------------
在此,我們假設 int 和 char 分別是 32 位和 8 位的。由上表可得,從 int 型到 char 型,損 失了 3 個字節的數據。而當我們要拿 char 型和 int 型比較的時候,char 型 會自動升級為 int 型。char 型升級為 int 型後的值會因為它到底是 signed char 還是 unsigned char 而有所不同。不幸的是,如果我們沒有使用 signed 或者 unsigned 來修飾 char,那麼我們無從知曉 char 到底是指 unsigned char 還是指 signed char,因為這是由編譯器決定的。不過,無論 char 是 signed 的也好,unsigned 的也罷,都不能改變使用 char 型變量接收 fgetc 等函數的返回值是錯誤的這個事實。唯一能改變的是該錯誤導致的後果。前面我 們說了,char 型和 int 型比較時,char 會自動升級為 int,下面我們來看看 signed char 和 unsigned char 在轉換成 int 後,它們的值有什麼不同:
---------------------------------------
| char | unsigned | signed |
|-------|---------------|-- -----------|
| 10 | 00 00 00 0A | 00 00 00 0A |
| FF | 00 00 00 FF | FF FF FF FF |
| FE | 00 00 00 FE | FF FF FF FE |
----------------------------- ----------
由上表可知,當 char 是 unsigned 的時候,其轉換為 int 後的值是正數。也就是說,假如我們把 c 定義為 char 型變量,而編譯器默認 char 為 unsigned char,那麼以下表達式將永遠成立。
(c = fgetc (fp)) != EOF /* c 的值永遠為正數,而標准規定 EOF 為負數 */
也就是說以下循環是一個死循環。
while ( (c = fgetc(fp)) != EOF )
{
putchar(c);
}
讀到這 裡,可能有些讀者朋友會說:“那麼我明確把 c 定義為 signed char 型 的就沒問題了吧!”很遺憾,就算把 c 定義為 signed char,仍然是錯誤 的。假設 fgetc 等函數讀到一個字節的值為 FF,那麼返回值就是 00 00 00 FF.把這個值賦值給 c 後, c 的值變成 FF.然後 c 的值為了和 EOF 比較,會 自動升級為 int 型的值,也就是 FF FF FF FF.從而導致以下表達式不成立。
(c = fgetc(fp)) != EOF /* 讀到值為 FF 的字符,誤認為 EOF */
也就是說以下循環在沒有讀完文件的情況下提前退出。
while ( (c = fgetc(fp)) != EOF )
{
putchar (c);
}
綜上所述,使用 char 型變量接收 fgetc 等函數的 返回值是錯誤的,我們必須使用 int 型變量接收這些函數的返回值,然後判斷 接收到的值是否 EOF.只有判斷發現該返回值並非 EOF,我們才可以把該值賦值 給 char 型變量。
同理,C++ 中,用 char 型變量接收 cin.get() 的 返回值也是錯誤的。不過,把 char 型變量當作參數傳遞給 cin.get 則是正確 的。例如:
char c = cin.get(); // 錯誤,理由同上
char c;
cin.get(c); // 正確