我們經常會要碰到把uft-8字符轉換在gbk或gb2312編碼,但在使用過程中轉換經常會碰到一些問題,下面我來介紹利用php自帶的字符串轉換函數來實現字符編碼轉換。
iconv函數的一個bug。iconv在轉換字符”—”到gb2312時會出錯
解決方法很簡單,就是在需要轉成的編碼後加 “//IGNORE” 也就是iconv函數第二個參數後.
如下:
以下為引用的內容:
ignore的意思是忽略轉換時的錯誤,如果沒有ignore參數,所有該字符後面的字符串都無法被保存。
這個iconv()這個函數,在php5中是內置的.
列子
代碼如下 復制代碼<?php
echo $str= '你好,這裡是賣咖啡!';
echo '<br />';
echo iconv('GB2312', 'UTF-8', $str); //將字符串的編碼從GB2312轉到UTF-8
echo '<br />';
echo iconv_substr($str, 1, 1, 'UTF-8'); //按字符個數截取而非字節
print_r(iconv_get_encoding()); //得到當前頁面編碼信息
echo iconv_strlen($str, 'UTF-8'); //得到設定編碼的字符串長度
//也有這樣用的
$content = iconv("UTF-8","gbk//TRANSLIT",$content);
?>
但是使用iconv函數可能會碰到如notice: iconv() [function.iconv]: detected an illegal character in input string ...錯誤了,
原因是因為這個編碼范圍的問題,gb2312小於gbk小於uft8哦,所以大家轉換時要注意了,不過我們php還提供了一個函數mb_detect_encoding他可以比較好的解決這個問題了。
現在把它寫成更專業的函數
代碼如下 復制代碼<?php
function phpcharset($data, $to) {
if(is_array($data)) {
foreach($data as $key => $val) {
$data[$key] = phpcharset($val, $to);
}
} else {
$encode_array = array('ASCII', 'UTF-8', 'GBK', 'GB2312', 'BIG5');
$encoded = mb_detect_encoding($data, $encode_array);
$to = strtoupper($to);
if($encoded != $to) {
$data = mb_convert_encoding($data, $to, $encoded);
}
}
return $data;
}
?>
有時我們不知道字符的編碼這時會需要先檢測出編碼再進行轉換。
代碼如下 復制代碼
function asciitog($brand)
{
$cha=mb_detect_encoding($brand);
if($cha=='utf-8')
{
$brand2 = iconv($cha,"gb2312",$brand);
}
$cha2=mb_detect_encoding($brand2);
if($cha2!='ascii'){
$brand=$brand2;
}
return $brand;
}