程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 數據庫知識 >> MYSQL數據庫 >> MySQL綜合教程 >> mysql 字符串長度盤算完成代碼(gb2312+utf8)

mysql 字符串長度盤算完成代碼(gb2312+utf8)

編輯:MySQL綜合教程

mysql 字符串長度盤算完成代碼(gb2312+utf8)。本站提示廣大學習愛好者:(mysql 字符串長度盤算完成代碼(gb2312+utf8))文章只能為提供參考,不一定能成為您想要的結果。以下是mysql 字符串長度盤算完成代碼(gb2312+utf8)正文


PHP對中文字符串的處置一向困擾於方才接觸PHP開辟的老手法式員。上面扼要的分析一下PHP對中文字符串長度的處置:

PHP自帶的函數如strlen()、mb_strlen()都是經由過程盤算字符串所占字節數來統計字符串長度的,一個英文字符占1字節。例:

$enStr = 'Hello,China!';
echo strlen($enStr); // 輸入:12

而中文則否則,做中文網站普通會選擇兩種編碼:gbk/gb2312或是utf-8。utf-8能兼容更多的字符,所以遭到許多站長的愛好。gbk與utf-8對中文的編碼分歧,招致中文在gbk與utf-8編碼下所占字節也有差別。

gbk編碼下每一個中文字符所占字節為2,例:

$zhStr = '您好,中國!';
echo strlen($zhStr); // 輸入:12

utf-8編碼下每一個中文字符所占字節為3,例:

$zhStr = '您好,中國!';
echo strlen($zhStr); // 輸入:18

那末若何盤算這組中文字符串的長度呢?有人能夠會說gbk下獲得中文字符串長度除以2,utf-8編碼下除以3不就好了嗎?然則您要斟酌字符串其實不誠實,99%的情形會以中英混雜的情形湧現。

這是WordPress中的一段代碼,重要思惟就是先用正則將字符串分化為個別單位,然後再盤算單位的個數即字符串的長度,代碼以下(只能處置utf-8編碼下的字符串):

$zhStr = '您好,中國!';
$str = 'Hello,中國!';

// 盤算中文字符串長度
function utf8_strlen($string = null) {
// 將字符串分化為單位
preg_match_all("/./us", $string, $match);
// 前往單位個數
return count($match[0]);
}
echo utf8_strlen($zhStr); // 輸入:6
echo utf8_strlen($str); // 輸入:9

utf8_strlen – 取得UTF8編碼的字符串的長度

/*
* 用於UTF8編碼的法式
* 取得字符串的長度,一個中文表現3個長度
* itlearner正文
*/
function utf8_strlen($str) {
$count = 0;
for($i = 0; $i < strlen($str); $i++){
$value = ord($str[$i]);
if($value > 127) {
$count++;
if($value >= 192 && $value <= 223) $i++;
elseif($value >= 224 && $value <= 239) $i = $i + 2;
elseif($value >= 240 && $value <= 247) $i = $i + 3;
else die('Not a UTF-8 compatible string');
}
$count++;
}
return $count;
}
  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved