由於程序中經常有大量對文件的輸入輸出操作,它經常構成了程序的主要部分,因而C語言提供了很多輸入輸出的函數,它們分別用於兩種類型文件輸入輸出系統:即由ANSI標准定義的緩沖文件(也稱標准文件(流)輸入輸出(I/O)系統);另一類是ANSI標准中沒有定義的非緩沖文件(也稱非標准文件(流)輸入輸出(I/O)系統)。
我們已經熟悉了通過鍵盤和顯示器進行輸入輸出的一些函數,如scanf(),printf()等等,這些通過控制台(鍵盤、顯示器等)進行I/O的操作,可以看作標准文件輸入輸出系統的一些特例,實際上在標准輸入輸出系統中的一些函數,有關文件的參數(文件結構指針或稱流指針),只要用標准設備的流指針代替,這些標准輸入輸出函數即成為控制台I/O函數。在任何程序執行時,C系統都定義了5個標准設備文件可供使用。自動打開的5個標准設備文件的文件結構指針(在標准I/O系統中)和文件代號將有一個規定值:
設備 標准文件I/O系統中的流指針名 非標准文件……
鍵盤(標准輸入) stdin 0
顯示器(標准輸出) stdout 1
顯示器(標准錯誤) stderr 2
串行口(標准輔助) stdoux 3
打印機(標准打印) stdprn 4
這樣,不論在標准文件系統還是非標准文件系統中,文件結構只要用上述的流指針或文件代號代替,則這些函數也均適用於控制台設備。
一、文本流和二進制流
在C中引入了流(stream)的概念。它將數據的輸入輸出看作是數據的流入和流出,這樣不管是磁盤文件或者是物理設備(打印機、顯示器、鍵盤等),都可看作一種流的源和目的,視他們為同一種東西,而不管其具體的物理結構,即對他們的操作,就是數據的流入和流出。這種把數據的輸入輸出操作對象,抽象化為一種流,而不管它的具體結構的方法很有利於編程,而涉及流的輸出操作函數可用於各種對象,與其具體的實體無關,即具有通用性。
在C中流可分為兩大類,即文本流(text stream)和二進制流(binary stream)。所謂文本流是指在流中流動的數據是以字符形式出現。在文本流中,'\n'被換成回車CR和換行LF的代碼0DH和0AH。而當輸出時,則0DH和0AH本換成'\n'。
二進制流是指流動的是二進制數字序列,若流中有字符,則用一個字節的二進制ASCII碼表示,若是數字,則用一個字節的二進制數表示。在流入流出時,對\n符號不進行變換。例如2001這個數,在文本流中用其ASCII碼表示為:
'2' '0' '0' '1'
| | | |
50 48 48 49
共占4字節。而在二進制流中則表示為:00000111 11010001 用十六進制就是07D1。只占兩字節。
由此看出,二進制流比文本流節省空間,且不用進行對\n的轉換,這樣可以大大加快流的速度,提高效率。因而,對於含有大量數字信息的數字流,可以采用二進制流的方式;對於含有大量字符信息的流,則采用文本流的方式。
二、流和文件
在C語言中流就是一種文件形式,它實際上就表示一個文件或設備(從廣義上講,設備也是一種文件)。把流當作文件總覺得不習慣,因而有人稱這種和流等同的文件為流式文件,流的輸入輸出也稱為文件的輸入輸出操作。當流到磁盤而成為文件時,意味著要啟動磁盤寫入操作,這樣流入一個字符(文本流)或流入一個字節(二進制流)均要啟動磁盤操作,將大大降低傳輸效率(磁盤是慢速設備),且降低磁盤的使用壽命。為此,C語言在輸入輸出的使用使用了緩沖技術,即在內存為輸入的磁盤文件開辟了一個緩沖區(缺省為512字節),當流到該緩沖區裝滿後,再啟動磁盤一次,將緩沖區內容裝到磁盤文件中去。讀取文件也是類似。
在C語言中將此種文件輸入輸出操作稱為標准輸入輸出,或稱流式輸入輸出(因這種輸入輸出操作是ANSI C推薦的標准)。還有一種是不帶緩沖文件輸入輸出,稱為非標准文件輸入輸出或低級輸入輸出,它將由DOS直接管理。關於這兩種輸入輸出文件系統下節將會介紹。
三、文件FILE的數據結構
typedef struct
{
short level;
unsigned flags;
char fd;
unsigned char hold;
short bsize;
unsigned char *buffer;
unsigned char *curp;
unsigned istemp;
short token;
}FILE;
這是Turbo C中使用的定義(在stdio.h文件中),不同的C編譯器,可能使用不同的定義,但基本含義變化不會太大。
flags: 是一個10位的標志字,其具體含義如下:
位 代表符號 含義
0 _F_READ 讀
1 _F_WRIT 寫
2 _F_BUF 由fclose釋放緩沖區
3 _F_LBUF 行緩沖
4 _F_ERR 出錯標志
5 _F_EOF EOF文件尾標志
6 _F_BIN 二進制方式
7 _F_IN 在進行輸入
8 _F_OUT 在進行輸出
9 _F_TERM 文件是一個終端
其他各字段內容以及flags字段內各位所的功能,請參照其他一些資料。這裡不多說了,它目前並不是我們要求的內容。
應該注意,不要把文件指針和FILE結構指針混為一談,它們代表兩個不同的地址。文件指針指出了對文件當前讀寫的數據位置,而FILE結構指針是指出了打開文件所對應的FILE結構在內存中的地址,這個指針它實際本身也包含了文件指針的信息。流指針中的各字段是供C語言內部使用的,用戶不應該存取它的任何字段。