程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> 關於PHP編程 >> PHP字符串長度計算 - strlen()函數使用介紹

PHP字符串長度計算 - strlen()函數使用介紹

編輯:關於PHP編程

strlen()函數和mb_strlen()函數

在PHP中,函數strlen()返回字符串的長度。函數原型如下:
復制代碼 代碼如下:
int strlen(string string_input);

參數string_input為要處理的字符串。

strlen()函數返回字符串所占的字節長度,一個英文字母、數字、各種符號均占一個字節,它們的長度均為1。一個中午字符占兩個字節,所以一個中午字符的長度是2。例如
復制代碼 代碼如下:
<?php
echo strlen("www.sunchis.com");
echo strlen("三知開發網");
?>

“echo strlen("www.sunchis.com");”的運行結果:15

“echo strlen("三知開發網");”的運行結果:15

這裡有一個疑問,一個中文字符不是占2個字節嗎?“三知開發網”,明明是五個漢字,運行的結果怎麼會是15?

原因出在這裡:strlen()計算時,對於一個UTF-8的中文字符,會把它當做長度為3來處理。當出現中英文混排的情況下,怎麼准確的計算字符串的長度呢?這裡,得引入另外一個函數mb_strlen()。mb_strlen()函數的用法與strlen()幾乎一摸一樣,只是多了一個指定字符集編碼的參數。函數原型為:
復制代碼 代碼如下:
int mb_strlen(string string_input, string encode);

PHP內置的字符串長度函數strlen無法正確處理中文字符串,它得到的只是字符串所占的字節數。對於GB2312的中文編碼,strlen得到的值是漢字個數的2倍,而對於UTF-8編碼的中文,就是3倍的差異了(在UTF-8編碼下,一個漢字占3個字節)。 因此,下面的代碼能准確計算出中文字符串的長度:
復制代碼 代碼如下:
<?php
$str = "三知sunchis開發網";
echo strlen($str)."<br>"; //結果:22
echo mb_strlen($str,"UTF8")."<br>"; //結果:12
$strlen = (strlen($str)+mb_strlen($str,"UTF8"))/2;
echo $strlen; //結果:17
?>

原理分析:

strlen()計算時,對待UTF-8的中文字符長度是3,所以“三知sunchis開發網”的長度為5×3+7×1=22
在mb_strlen計算時,選定內碼為UTF8,則會將一個中文字符當作長度1來計算,所以“三知sunchis開發網”長度為5×1+7×1=12

剩下的就是純數學問題了,在此就不啰嗦了……

注意:對於mb_strlen($str,'UTF-8'),如果省略第二個參數,則會使用PHP的內部編碼。內部編碼可以通過mb_internal_encoding()函數得到。需要注意的是,mb_strlen並不是PHP核心函數,使用前需要確保在php.ini中加載了php_mbstring.dll,即確保“extension=php_mbstring.dll”這一行存在並且沒有被注釋掉,否則會出現未定義函數的問題。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved