•字符串字面量(字符串常量,在C標准中稱為,字符串字面量)
如何存儲字符串字面量
從本質上而言,C語言把字符串字面量作為字符數組來處理。當C語言編譯器在程序中遇到長度為n的字符串字面量時,它會為字符串字面量分配長度為n+1的內存空間,在末尾增加一個額外的字符——空字符(\0)。
字符串字面量的操作
通常情況下可以在任何C語言允許使用 char * 指針的地方使用字符串字面量。如:
char *p;p = "abc";這個賦值操作不是復制 "abc" 中的字符,而僅僅是使 p 指向字符串的第一個字符。
•字符串變量
一些編程語言為聲明字符串提供了特殊的 string 類型。C語言采取了不同的方式:只要保證字符串是以空字符串結尾的,任何一維的字符數組都可以用來存儲字符串。如果編寫自己的字符串處理函數,請千萬注意要正確地處理空字符。
假設需要變量用來存儲最多80個字符的字符串。既然字符串會在末尾處需要空字符,那麼要聲明的變量是含有81個字符的數組。
#define STR_LEN 80/* 慣用法 */char str[STR_LEN + 1];對宏加一的這種方法是C程序員常用的方式。
初始化字符串變量
char date1[8] = "June 14";date1: | J | u | n | e | | 1 | 4 | \0 |
char date2[9] = "June 14";date2: | J | u | n | e | | 1 | 4 | \0 | \0 |
大體上來說,這種行為與C語言處理數組初始化的方法一致。
字符串變量的聲明可以忽略它的長度。這種情況下,編譯器會自動計算長度:
char date3[] = "June 14";編譯器為date3分配8個字符的空間。
字符數組與字符指針
一起來比較一下下面兩個聲明:
char date[] = "June 14";它聲明date是個字符數組。和這個聲明相似的是下面這個聲明:
char *date = "June 14";它聲明date是個指向字符串字面量的指針。
[注意],不能錯誤地認為上面兩種date可以互換。兩者之間有著顯著的差異:
(1) 在聲明為數組時,就像任意數組元素一樣,可以修改存儲在date中的字符。在聲明為指針時,date指向字符串字面量。
(2) 在聲明為數組時,date是數組名。在聲明為指針時,date是變量,這個變量可以在程序執行期間指向其他字符串。
如果需要可以修改的字符串,那麼就要建立字符數組來存儲字符串。這時聲明指針變量是不夠的。下面的聲明使編譯器為指針變量分配了足夠的內存空間:
char *p;可惜的是,它不為字符串分配空間。在使用p作為字符串之前,必須把p指向字符串數組。一種可能是把p指向已經存在的字符串變量:
char str[STR_LEN + 1], *p;p = str;
現在p指向了str的第一個字符,所以可以把p作為字符串使用了。
字符串的讀寫
用 printf 函數和 puts 函數寫字符串
%s 允許 printf 函數寫字符串。如:
char str[] = "Are we having fun yet?";printf("Value of str: %s\n", str);如果只顯示字符串的一部分,可以用 %.ps。這裡的 p 是要顯示的字符數量。語句
printf("%.6s\n", str);會顯示出
Are we C函數庫還提供puts函數。
puts(str);
用 scanf 函數和 gets 函數讀字符串
在 scanf 函數調用中,不需要在 str 前添加運算符 &。因為 str 是數組名,編譯器會自動把它當作指針來處理。調用時,scanf 函數會跳過空白字符,然後讀入字符,並且把讀入的字符存儲到 str 中,知道遇到空白字符為止。scanf 函數始終會在字符串末尾存儲一個空字符。用 scanf 函數讀入字符串永遠不會包含空白字符。因此,scanf 函數通常不會讀入一整行輸入。換行符會使 scanf 函數停止讀入,空格符或制表符也會產生同樣的效果。可以參考下面的例子:
int read_line(char strp[], int n){ char ch; int i = 0; while((ch = getchar()) != '\n') if(i < n) str[i++] = ch; str[i] = '\0'; /* terminates string */ return i; /* number of characters stored */}
運行結果如下:
Input a string:this is a stringString is:this為了每次讀入一整行輸入,可以使用 gets 函數。類似於 scanf 函數,gets 函數把讀入的字符放到數組中,然後存儲一個空字符。然而,在其他方面 gets 函數有些不同於 scanf 函數:
(1) gets 函數不會在開始讀字符串之前跳過空白字符( scanf 函數會跳過)。
(2) gets 函數會持續讀入直到找到換行符才停止(scanf 函數會在任意空白字符處停止)。
此外,gets 函數會忽略掉換行符,而不會把它存儲到數組中,用空字符代替換行符。
逐個字符讀字符串
因為 scanf 函數和 gets 函數都有風險且不夠靈活,C 程序員經常會編寫自己的輸入函數。通過每次一個字符的方式來讀入字符串。下面是自己編寫的讀取字符串的函數 read_line():
int read_line(char strp[], int n){ char ch; int i = 0; while((ch = getchar()) != '\n') if(i < n) str[i++] = ch; str[i] = '\0'; /* terminates string */ return i; /* number of characters stored */}返回之前,read_line 函數在字符串的末尾放置了一個空字符。就像 scanf 函數和 gets 函數一樣,標准函數會自動在輸入字符串的末尾放置一個空字符串。然而,如果自己寫輸入函數,必須要考慮到這一點。