復制代碼 代碼如下:
iconv('GBK', 'UTF-8//IGNORE', ''); // 將字符串由 GBK 編碼轉換為 UTF-8 編碼
但 iconv 只能解決編碼預先知道的情況,如果字符串編碼未知,則需要先探測其編碼,這時可能會用到 mb_string 擴展庫:
復制代碼 代碼如下:
mb_detect_encoding('');
可是 mb_detect_encoding 存在一個硬傷,經常出現判斷不准確的情況。或許這樣就可以解決:
復制代碼 代碼如下:
// 使用 iconv 轉換並判斷是否等值,效率不高
function is_utf8 ($str) {
if ($str === iconv('UTF-8', 'UTF-8//IGNORE', $str)) {
return 'UTF-8';
}
}
// 多種編碼的情況
function detect_encoding ($str) {
foreach (array('GBK', 'UTF-8') as $v) {
if ($str === iconv($v, $v . '//IGNORE', $str)) {
return $v;
}
}
}
通過以上方式得到字符串編碼信息後,就可以利用 iconv 或 mb_convert_encoding 來轉換編碼了。