程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> C語言 >> 關於C語言 >> C語言中的字符串處理基礎教程

C語言中的字符串處理基礎教程

編輯:關於C語言
 

•字符串字面量(字符串常量,在C標准中稱為,字符串字面量)

如何存儲字符串字面量
  從本質上而言,C語言把字符串字面量作為字符數組來處理。當C語言編譯器在程序中遇到長度為n的字符串字面量時,它會為字符串字面量分配長度為n+1的內存空間,在末尾增加一個額外的字符——空字符(\0)。

字符串字面量的操作
  通常情況下可以在任何C語言允許使用 char * 指針的地方使用字符串字面量。如:

char *p;p = "abc";這個賦值操作不是復制 "abc" 中的字符,而僅僅是使 p 指向字符串的第一個字符。


•字符串變量
  一些編程語言為聲明字符串提供了特殊的 string 類型。C語言采取了不同的方式:只要保證字符串是以空字符串結尾的,任何一維的字符數組都可以用來存儲字符串。如果編寫自己的字符串處理函數,請千萬注意要正確地處理空字符。
  假設需要變量用來存儲最多80個字符的字符串。既然字符串會在末尾處需要空字符,那麼要聲明的變量是含有81個字符的數組。

#define STR_LEN 80/* 慣用法 */char str[STR_LEN + 1];對宏加一的這種方法是C程序員常用的方式。

初始化字符串變量
char date1[8] = "June 14";date1: | J | u |  n | e |   | 1 | 4 | \0 |


char date2[9] = "June 14";date2: | J | u |  n | e |   | 1 | 4 | \0 | \0 |
大體上來說,這種行為與C語言處理數組初始化的方法一致。
字符串變量的聲明可以忽略它的長度。這種情況下,編譯器會自動計算長度:

char date3[] = "June 14";編譯器為date3分配8個字符的空間。
 
字符數組與字符指針
一起來比較一下下面兩個聲明:

char date[] = "June 14";它聲明date是個字符數組。和這個聲明相似的是下面這個聲明:

char *date = "June 14";它聲明date是個指向字符串字面量的指針。
[注意],不能錯誤地認為上面兩種date可以互換。兩者之間有著顯著的差異:
(1) 在聲明為數組時,就像任意數組元素一樣,可以修改存儲在date中的字符。在聲明為指針時,date指向字符串字面量。
(2) 在聲明為數組時,date是數組名。在聲明為指針時,date是變量,這個變量可以在程序執行期間指向其他字符串。
  如果需要可以修改的字符串,那麼就要建立字符數組來存儲字符串。這時聲明指針變量是不夠的。下面的聲明使編譯器為指針變量分配了足夠的內存空間:

char *p;可惜的是,它不為字符串分配空間。在使用p作為字符串之前,必須把p指向字符串數組。一種可能是把p指向已經存在的字符串變量:

char str[STR_LEN + 1], *p;p = str;

現在p指向了str的第一個字符,所以可以把p作為字符串使用了。

字符串的讀寫
  用 printf 函數和 puts 函數寫字符串


  %s 允許 printf 函數寫字符串。如:

char str[] = "Are we having fun yet?";printf("Value of str: %s\n", str);如果只顯示字符串的一部分,可以用 %.ps。這裡的 p 是要顯示的字符數量。語句

printf("%.6s\n", str);會顯示出

Are we  C函數庫還提供puts函數。

puts(str);  

   用 scanf 函數和 gets 函數讀字符串

  在 scanf 函數調用中,不需要在 str 前添加運算符 &。因為 str 是數組名,編譯器會自動把它當作指針來處理。調用時,scanf 函數會跳過空白字符,然後讀入字符,並且把讀入的字符存儲到 str 中,知道遇到空白字符為止。scanf 函數始終會在字符串末尾存儲一個空字符。用 scanf 函數讀入字符串永遠不會包含空白字符。因此,scanf 函數通常不會讀入一整行輸入。換行符會使 scanf 函數停止讀入,空格符或制表符也會產生同樣的效果。可以參考下面的例子:

int read_line(char strp[], int n){ char ch; int i = 0; while((ch = getchar()) != '\n') if(i < n) str[i++] = ch; str[i] = '\0'; /* terminates string */ return i; /* number of characters stored */}

運行結果如下:
Input a string:this is a stringString is:this為了每次讀入一整行輸入,可以使用 gets 函數。類似於 scanf 函數,gets 函數把讀入的字符放到數組中,然後存儲一個空字符。然而,在其他方面 gets 函數有些不同於 scanf 函數:

  (1) gets 函數不會在開始讀字符串之前跳過空白字符( scanf 函數會跳過)。

  (2) gets 函數會持續讀入直到找到換行符才停止(scanf 函數會在任意空白字符處停止)。

  此外,gets 函數會忽略掉換行符,而不會把它存儲到數組中,用空字符代替換行符。

  逐個字符讀字符串

  因為 scanf 函數和 gets 函數都有風險且不夠靈活,C 程序員經常會編寫自己的輸入函數。通過每次一個字符的方式來讀入字符串。下面是自己編寫的讀取字符串的函數 read_line():
 
int read_line(char strp[], int n){    char ch;    int i = 0;    while((ch = getchar()) != '\n')        if(i < n)            str[i++] = ch;    str[i] = '\0';    /* terminates string */    return i;         /* number of characters stored */}返回之前,read_line 函數在字符串的末尾放置了一個空字符。就像 scanf 函數和 gets 函數一樣,標准函數會自動在輸入字符串的末尾放置一個空字符串。然而,如果自己寫輸入函數,必須要考慮到這一點。

 
  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved