程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> PHP綜合 >> 詳解PHP中的mb_detect_encoding函數使用方法

詳解PHP中的mb_detect_encoding函數使用方法

編輯:PHP綜合

php中可以使用 mb_detect_encoding() 函數來判斷字符串是什麼編碼的。

當在php中使用mb_detect_encoding函數進行編碼識別時,很多人都碰到過識別編碼有誤的問題,例如對與GB2312和UTF-8,或者UTF-8和GBK(這裡主要是對於cp936的判斷),網上說是由於字符短時mb_detect_encoding會出現誤判。

代碼如下:
 

$encode = mb_detect_encoding($keytitle, array("ASCII","UTF-8","GB2312","GBK","BIG5"));
if($encode == "UTF-8"){
  $keytitle = iconv("UTF-8","GBK",$keytitle);
}

這段代碼的作用是檢測字符串的編碼是否UTF-8,是的話就轉換為GBK。
可是當 $keytitle = “%D0%BE%C6%AC”;時。檢測結果卻是UTF-8.這個bug其實不算是bug,寫程序時也不應當過於依賴mb_detect_encoding,當字符串較短時,檢測結果產生偏差的可能性很大。
解決辦法,代碼如下:
 

$encode = mb_detect_encoding($keytitle, array("ASCII","GB2312","GBK","UTF-8");

三個參數分別是:被檢測的輸入變量、編碼方式的檢測順序(一旦為真,後面自動忽略)、strict模式對編碼檢測的順序進行調整,將最大可能性放在前面,這樣減少被錯誤轉換的機會。
一般要先排gb2312,當有GBK和UTF-8時,需要將常用的排列到前面。

PHP字符串編碼的轉換和判斷


GBK 和 UTF-8 編碼的轉換是一個非常惡心的事情,比如像 PHP 中的 json_encode 本身根本不支持 GBK 形式的編碼。有兩個庫函數能夠支持編碼的轉換,通常能夠想到的就是 iconv 函數,使用起來也非常爽:
 
iconv('GBK', 'UTF-8//IGNORE', '測試字符串'); // 將字符串由 GBK 編碼轉換為 UTF-8 編碼

但 iconv 只能解決編碼預先知道的情況,如果字符串編碼未知,則需要先探測其編碼,這時可能會用到 mb_string 擴展庫:
 
mb_detect_encoding('測試字符串');

可是 mb_detect_encoding 存在一個硬傷,經常出現判斷不准確的情況。或許這樣就可以解決:

 

// 使用 iconv 轉換並判斷是否等值,效率不高
function is_utf8 ($str) {
  if ($str === iconv('UTF-8', 'UTF-8//IGNORE', $str)) {
    return 'UTF-8';
  }
}
// 多種編碼的情況
function detect_encoding ($str) {
  foreach (array('GBK', 'UTF-8') as $v) {
    if ($str === iconv($v, $v . '//IGNORE', $str)) {
      return $v;
    }
  }
}

通過以上方式得到字符串編碼信息後,就可以利用 iconv 或 mb_convert_encoding 來轉換編碼了。

Call to undefined function mb_detect_encoding()錯誤解決


Windows系統下:
一、Fatal error: Call to undefined function: iconv() in C:\Program Files\AppServ\www\...\xxx.php on line 82
php中有個iconv()函數用來進行字符編碼轉換
在php.ini文件中同樣存在extension=php_iconv.dll
這樣的聲明才能保證這個函數正常使用
如果在php.ini文件中的extension=php_iconv.dll前面有分號
表示被注釋掉了,如果存在分號就要去掉,並重新啟動服務器
再次運行程序才能解決

二、Fatal error: Call to undefined function: mb_detect_encoding() in C:\Program Files\AppServ\www\...\xxx.php on line 1355
1、找到php擴展目錄(我的php擴展目錄的路徑是:C:\Program Files\AppServ\php\extensions)
     在extensions目錄下面找到php_mbstring.dll文件,
2、將php_mbstring.dll這個文件拷貝到php.ini文件所在的目錄下(我的php.ini文件所在的目錄:C:\WINDOWS)
3、用記事本打開php.ini文件,使用快捷鍵Ctrl+F查找extension=php_mbstring.dll
4、 如果php.ini文件中存在extension=php_mbstring.dll,去掉該行extension前面的分號,
      如果不存在,就在其他extension=...的下一行加入extension=php_mbstring.dll,
      最終記得保存php.ini文件
5.   重新啟動你的Apache服務器

剛剛發現其實不拷貝php_mbstring.dll這個文件到php.ini所在目錄也行

Linux系統下:

出現下面問題時:

PHP   1. {main}() /home/xu/web/whois/ab.cn.php:0
PHP   2. base_func->is_exist() /home/xu/web/whois/ab.cn.php:21
PHP   3. strftime() /home/xu/web/whois/whois.mysql.php:46
ab.cnis exist<br />PHP Fatal error:  Call to undefined function mb_detect_encoding() in /home/xu/web/whois/whois.main.php on line 98
在網上查找了各種資料後才知道原來是php-mbstring這個php插件沒有安裝(有些同學可能是沒有在php.ini中起用此插件),寫下此段文件以作筆記。

    首先使用yum或者apt安裝mbstring.so,使用命令:yum install php-mbstring或者apt-get install php-mbstring (ubuntu用戶最好使用apt-cache search mbstring搜索一番後再安裝,軟件名字可能有誤)

    然後修改php.ini:執行vim /etc/php.ini,加入extension="/usr/lib/php/modules/mbstring.so"內容,後面的路徑可能不一樣,根據mbstring.so存放的目錄做相應的修改即可。一般是不用更改的。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved