字符編碼判斷是我們時常全用於的一些東西,特別是我想判斷用戶輸入的或提交過來的字符是什麼編碼從而進行有效的處理,下面我來給大家介紹php判斷字符串編碼函數
mb_detect_encoding()($str);
代碼如下 復制代碼
//判斷字符串是什麼編碼
if ($tag === mb_convert_encoding(mb_convert_encoding($tag, "GB2312", "UTF-8"), "UTF-8", "GB2312")) {
}
else {//如果是gb2312 的就轉換為utf8的
$tag = mb_convert_encoding($tag, 'UTF-8', 'GB2312');
}
函數可以檢測編碼不過使用該函數必須打開php的extension=php_mbstring.dll擴展,如果大家使用的是空間而沒修改
php.ini配置文件夾的權限會不會有更好的函數來檢查字符串編碼呢,答應是肯定的
判斷字符串是否為UTF-8編碼
代碼如下 復制代碼/**
+----------------------------------------------------------
* 檢查字符串是否是UTF8編碼
+----------------------------------------------------------
* @param string $string 字符串
+----------------------------------------------------------
* @return Boolean
+----------------------------------------------------------
*/
function is_utf8($string)
{
return preg_match('%^(?:
[x09x0Ax0Dx20-x7E] # ASCII
| [xC2-xDF][x80-xBF] # non-overlong 2-byte
| xE0[xA0-xBF][x80-xBF] # excluding overlongs
| [xE1-xECxEExEF][x80-xBF]{2} # straight 3-byte
| xED[x80-x9F][x80-xBF] # excluding surrogates
| xF0[x90-xBF][x80-xBF]{2} # planes 1-3
| [xF1-xF3][x80-xBF]{3} # planes 4-15
| xF4[x80-x8F][x80-xBF]{2} # plane 16
)*$%xs', $string);
}
可檢查出GB2312還是UTF-8
代碼如下 復制代碼function is_gb2312($str)
{
for($i=0; $i<strlen($str); $i++) {
$v = ord( $str[$i] );
if( $v > 127) {
if( ($v >= 228) && ($v <= 233) )
{
if( ($i+2) >= (strlen($str) - 1)) return true; // not enough
characters
$v1 = ord( $str[$i+1] );
$v2 = ord( $str[$i+2] );
if( ($v1 >= 128) && ($v1 <=191) && ($v2 >=128) && ($v2 <= 191) ) // utf
編碼
return false;
else
return true;
}
}
}
return true;
}
有些朋友說可以使用mb_check_encoding函數來檢查,這個本人沒測試過大家可自行測試哦。