無論哪種語言,字符串操作都是一個重要的基礎,往往是簡單而重要。正像人說話一樣,一般有形體(圖形界面),有語言(print 字符串?),顯然字符串能解釋更多的東西。PHP提供了大量的字符串操作函數,功能強大,使用也比較簡單,詳細請參看 http://cn2.php.net/manual/zh/ref.strings.php . 以下將簡單的講述它的功能和特性。
弱類型
PHP是弱類型語言,所以其它類型的數據一般可以直接應用於字符串操作函數裡,而自動轉換成字符串類型,進行處理,如:
echo substr("1234567", 1, 3);
和
echo substr(123456,1, 3);
是一樣的
定義
一般用雙引號或單引號標識一個字符串。比如
$str = "i love u";
$str = 'i love u';
它者兩者是有一些區別的。後者將一切單引號的內容都會當作字符處理;前者則不然。比如
$test = "iwind";
$str = "i love $test";
$str1 = 'i love $test';
echo $str; //將得到 i love iwind
echo $str1; //將得到 i love $test
同樣的以下兩個例子的行為也不一樣的:
echo "i love test"; // 將得到 i love est,已經將t視為轉義
echo 'i love test'; // 將得到 i love test
從而可以簡單認為雙引號裡的內容是經過“解釋”過的,單引號的是“所見即所得”的(特殊地,''會被認作一個'')。顯而易見,雙引號形式的更為靈活一些,當然單引號會適用於一些特殊的場合,這裡就不作闡述了。
輸出
PHP裡的輸出最常用的是echo,print.兩者都不是真正的函數,而是語言構造,所以調用時不必用雙括號(比如
echo("test");print("test")).在輸出的時候兩者都可以實現賦值:
echo $str="test"; //一方面輸出test,一方面把"test"賦給字符串變量 $str
print $str="test";
兩者除了名字不一樣外,還是有其它區別的。print具有返回值,一直返回1,而echo沒有,所以echo比print要快一些:
$return = print "test";
echo $return; // 輸出1
也正因為這個原因,print能應用於復合語句中,而echo不能:
isset($str) or print "str 變量未定義"; // 將輸出"str 變量未定義"
isset($str) or echo "str 變量未定義";// 將提示分析錯誤
echo一次可輸出多個字符串,而print則不可以:
echo "i ","love ","iwind"; // 將輸出 "i love iwind"
print "i ","love ","iwind"; // 將提示錯誤
echo,print還可以輸出被稱作“文檔句法”的字符串,句法如:
echo <<< 標簽名稱
...
字符串內容
...
標簽名稱;
比如
echo <<< test
i love iwind
test;
要注意的是語句開始和結束的兩個標簽名稱是一樣的,且後一個標簽名稱前不能有空白,即要頂格寫。文檔句法輸出的內容識別變量名稱和常用符號,大致形同雙引號的作用。
輸出echo,print外,PHP還提供了一些格式化字符串的函數,比如printf,sprintf,vprintf,vsprintf,在這裡不作詳解。
連接
兩個以上的字符串連接用"."操作符,依字符串的順序形成新的字符串。
$str = "i " . "love " . "iwind";
這裡的$str 就是 "i love iwind";字符串。當然,還可以使用 .= 操作符:
$str = ""; // 初始化
$str .= "i love iwind";
這裡用到了初始化,是因為未定義變量在使用時會產生一個notice錯誤,""或者null可以簡單地代表空字符串。
長度
PHP提供strlen函數來計算字符串的長度:
$str = "test";
echo strlen($str); // 將輸出 4
有點奇怪的是strlen將中日等漢字以及全角字符都當作兩個或四個長度計算。好在mbstring或icon兩個函數可以幫助解決這個問題,比如:
$len = iconv_strlen($str, "GBK");
$len = mb_strlen($str, "GBK");
注:mbstring模塊提供了大量的對含有多字節字符的字符串的處理函數,推薦多加應用,由於這篇文章講的是字符串入門,所以不打算詳細解說。
分隔與連接
PHP允許你把一個字符串按照一個分隔符進行分隔成一個數組,或者將一個數組組合成一個字符串。看下面的例子:
$str = "i love iwind";
$array = explode(" ", $str);
上面的explode函數,就把$str字符串按空格字符進行分隔,結果返回一個數組 $array:array("i", "love", "iwind").與explode函數有類似功能的有:preg_split(), spliti(), split()等函數。
與此相反的,implode和join則能把一個數組結合成一個字符串,他們是具有完全相同功能的函數。
$array = array("i", "love", "iwind");
$str = implode(" ", $array);
例中的implode函數將數組$array的每個元素用空格字符進行連接,返回一個字符串 $str: "i love iwind".
裁剪
一個字符串首和尾,可能不是你想要的部分,就可以用trim,rtrim,ltrim等函數,分別去除一個字符串兩端空格,一個字符串尾部空格,一個字符串首部空格。
echo trim(" i love iwind "); // 將得到 "i love iwind"
echo rtrim(" i love iwind "); // 將得到 " i love iwind"
echo ltrim(" i love iwind "); // 將得到 "i love iwind "
其實這三個參數不僅可以去除字符串首尾的空格,還可以去除它們的第二個參數指定的字符,如:
echo trim(",1,2,3,4,", ","); // 將得到 1,2,3,4 兩端的","號被裁掉了。
有時還會看到有人使用chop這個函數,其實它是rtrim的同義函數。
大小寫
對於英文字母來說,可以用strtoupper,strtolower將其轉變成大寫或小寫。
echo strtoupper("i love iwind"); // 將得到 I LOVE IWIND
echo strtolower("I LOVE IWIND"); // 將得到 i love iwind
比較
一般可以用 !=, == 比較兩個對象是否相等,只所以說是兩個對象,是因為它們不一定全部為字符串,也可以為整型等等。比如
$a = "joe";
$b = "jerry";
if ($a != $b)
{
echo "不相等";
}
else
{
echo "相等";
}
如果用 !==,===(可以看到多了一個等號)比較的話,兩個對象的類型要嚴格相等才能返回true;否則用==,!=則會將字符串自動轉換成相應的類型,以便進行比較.
22 == "22"; // 返回 true
22 === "22"; // 返回false
正因為這樣,所以我們的程序時常會發生一些想不到的“意外”:
0 == "我愛你"; // 返回true
1 == "1 我愛你";// 返回true
PHP裡還有這樣一組用於字符串比較的函數:strcmp,strcasecmp,strncasecmp(), strncmp(),它們都是如果前者比後者大,則返回大於0的整數;如果前者比後者小,則返回小於0的整數;如果兩者相等,則返回0.它們比較的原理與其它語言的規則都是一樣的。
strcmp是用於區分大小寫(即大小寫敏感)的字符串比較:
echo strcmp("abcdd", "aBcde"); // 返回 1 (>0), 比較的是 "b"和"B"
strcasecmp用於不區分大小寫的字符串比較:
echo strcasecmp("abcdd", "aBcde"); // 返回 -1 (<0), 比較的是"d"和"e"
strncmp用於比較字符串的一部分,從字符串的開頭開始比較,第三個參數,為要比較的長度:
echo strncmp("abcdd", "aBcde", 3); // 返回 1 (>0), 比較了 abc 和 aBc
strncasecmp用於不區分大小寫的比較字符串的一部分,從字符串的開頭開始比較,第三個參數,為要比較的長度:
echo strncasecmp("abcdd", "aBcde", 3); // 返回 0, 比較了 abc 和 aBc, 由於不區分大小寫,所以兩者是相同的。
還有一種情況是單單比較字符串大小,達不到我們預定的要求,比如照常理 10.gif 會比 5.gif 大,但如果應用上面幾個函數,就會返回 -1,即表示 10.gif比5.gif,針對這種情況,PHP提供了兩個自然對比的函數strnatcmp,strnatcasecmp:
echo strnatcmp("10.gif", "5.gif"); // 返回 1 (>0)
echo strnatcasecmp("10.GIF", "5.gif"); // 返回 1 (>0)
替換
替換的意義在於將一個字符串的一部分進行改變,使之成為別外一個新的字符串,以滿足新的要求。PHP裡通常用str_replace("要替換的內容", "要取代原內容的字符串", "原字符串")進行替換。
echo str_replace("iwind", "kiki", "i love iwind, iwind said"); // 將輸出 "i love kiki, kiki said"
即將 原字符串中的所有"iwind"都替換成了"kiki".
str_replace是大小寫敏感的,所以對你不能設想用 str_replace("IWIND", "kiki",...)替換原字符串中的"iwind".
str_replace還可以實現多對一,多對多的替換,但無法實現一對多的替換:
echo str_replace(array("iwind", "kiki"), "people", "i love kiki, iwind said");
將會輸出
i love people, people said
第一個參數中的array("iwind", "kiki")都被替換成了"people"
echo str_replace(array("iwind", "kiki"), array("gentle man", "ladies"), "i love kiki, iwind said");
輸出 i love ladies, gentle man said 。也就是說第一個數組中的元素被第二個數組中的相對應的元素替換掉了,如果有一個數組比另一個數組元素數要少,那麼不足的都會當作空來處理。
與此有些類似的是strtr,用法請參閱手冊.
此外,PHP還提供了substr_replace,實現替換一部分的字符串。語法如下:
substr_replace (原字符串, 要替代的字符串, 開始替換的位置 [, 替換的長度])
其中,開始替換的位置從0開始計算,應該小於原字符串的長度。要替換的長度是可選的。
echo substr_replace("abcdefgh", "DEF", 3); // 將輸出 "abcDEF"
echo substr_replace("abcdefgh", "DEF", 3, 2); // 將輸出 "abcDEFfgh"
第一個例子中,從第三個位置(即"d")開始替換,從而把 "defgh"都替換成了“DEF”
第二個例子中,也是從第三個位置(即"d")開始替換,但只能替換2個長度,即到e,所以就把"de"替換成了"DEF".
PHP還提供了preg_replace,preg_replace_callback,ereg_replace,eregi_replace等函數應用正則表達式來完成字符串替換,用法請參考手冊。
查找與匹配
PHP裡用於查找或者匹配或者定位的函數非常多,它們都有不同的意義。這裡只講述用得比較多的strstr,stristr.後者與前者的功能,返回值都一樣,只是不區分大小寫。
strstr("母字符串", "子字符串")用來查找子字符串在母字符串中第一次出現的位置,並返回母字符串中從子字符串開始到母字符串結束的部分。比如
echo strstr("abcdefg", "e"); //將輸出 "efg"
如果找不到子字符串,則返回空。因為可以用來判斷一個字符串中是否含有另外一個字符串:
$needle = "iwind";
$str = "i love iwind";
if (strstr($str, $needle))
{
echo "裡面有 iwind";
}
else
{
echo "裡面沒有 iwind";
}
將會輸出"裡面有 iwind"
HTML相關
1,htmlspecialchars($string)
這是它的最簡單用法,將字符串中的一些特殊字符(顧名思義)&,',"<,>轉換成它們對應的HTML實體形式:
$str = "i love <font color="red">kiki</font>, iwind said.";
echo htmlspecialchars($str);
將會輸出
i love kiki, iwind said.
2,htmlentities($string)
將所有能轉換成實體形式的字符都轉換成實體形式。
3,html_entity_decode($string);
PHP4.3.0以後加入的具有與htmlentities($string)相反的功能。
4,nl2br($string)
將字符串中所有換行符轉變成< b r /> + 換行符。如:
$str = "i love kiki,\n iwind said.";
echo nl2br($str);
將會輸出
i love kiki,
iwind said.
加密
加密字符串最常用的就是md5了,它將一個字符串轉換成一個長32位的唯一的字符串。
echo md5("i love iwind"); // 將輸出 "2df89f86e194e66dc54b30c7c464c21c"
PHP5給md5加了第二個參數,從而使它可以輸出16位的加密後的字符串。
到這裡,這篇字符串操作入門教程就算結束了,但上面講的這些還只是它的冰山一角,特別是PHP5之後增加了大量的新功能,所以需要我們不斷的去學習它才有可能很好的應用。