文件
文件的基本概念
所謂“文件”是指一組相關數據的有序集合。 這個數據集有一個名稱,叫做文件名。 實際上在前面的各章中我們已經多次使用了文件,例如源程序文件、目標文件、可執行文件、庫文件 (頭文件)等。文件通常是駐留在外部介質(如磁盤等)上的, 在使用時才調入內存中來。從不同的角度可對文件作不同的分類。從用戶的角度看,文件可分為普通文件和設備文件兩種。
普通文件是指駐留在磁盤或其它外部介質上的一個有序數據集,可以是源文件、目標文件、可執行程序; 也可以是一組待輸入處理的原始數據,或者是一組輸出的結果。對於源文件、目標文件、 可執行程序可以稱作程序文件,對輸入輸出數據可稱作數據文件。
設備文件是指與主機相聯的各種外部設備,如顯示器、打印機、鍵盤等。在操作系統中,把外部設備也看作是一個文件來進行管理,把它們的輸入、輸出等同於對磁盤文件的讀和寫。 通常把顯示器定義為標准輸出文件, 一般情況下在屏幕上顯示有關信息就是向標准輸出文件輸出。如前面經常使用的printf,putchar 函數就是這類輸出。鍵盤通常被指定標准的輸入文件, 從鍵盤上輸入就意味著從標准輸入文件上輸入數據。scanf,getchar函數就屬於這類輸入。
從文件編碼的方式來看,文件可分為ASCII碼文件和二進制碼文件兩種。
ASCII文件也稱為文本文件,這種文件在磁盤中存放時每個字符對應一個字節,用於存放對應的ASCII碼。例如,數5678的存儲形式為:
ASC碼: 00110101 00110110 00110111 00111000
↓ ↓ ↓ ↓
十進制碼: 5 6 7 8 共占用4個字節。ASCII碼文件可在屏幕上按字符顯示, 例如源程序文件就是ASCII文件,用DOS命令TYPE可顯示文件的內容。 由於是按字符顯示,因此能讀懂文件內容。
二進制文件是按二進制的編碼方式來存放文件的。 例如, 數5678的存儲形式為: 00010110 00101110只占二個字節。二進制文件雖然也可在屏幕上顯示, 但其內容無法讀懂。C系統在處理這些文件時,並不區分類型,都看成是字符流,按字節進行處理。 輸入輸出字符流的開始和結束只由程序控制而不受物理符號(如回車符)的控制。 因此也把這種文件稱作“流式文件”。
本章討論流式文件的打開、關閉、讀、寫、 定位等各種操作。文件指針在C語言中用一個指針變量指向一個文件, 這個指針稱為文件指針。通過文件指針就可對它所指的文件進行各種操作。 定義說明文件指針的一般形式為: FILE* 指針變量標識符; 其中FILE應為大寫,它實際上是由系統定義的一個結構, 該結構中含有文件名、文件狀態和文件當前位置等信息。 在編寫源程序時不必關心FILE結構的細節。例如:FILE *fp; 表示fp是指向FILE結構的指針變量,通過fp 即可找存放某個文件信息的結構變量,然後按結構變量提供的信息找到該文件, 實施對文件的操作。習慣上也籠統地把fp稱為指向一個文件的指針。文件的打開與關閉文件在進行讀寫操作之前要先打開,使用完畢要關閉。 所謂打開文件,實際上是建立文件的各種有關信息, 並使文件指針指向該文件,以便進行其它操作。關閉文件則斷開指針與文件之間的聯系,也就禁止再對該文件進行操作。
在C語言中,文件操作都是由庫函數來完成的。 在本章內將介紹主要的文件操作函數。