在php中如果我們把uft8字符串轉換成gbk或gb2312都會出現亂碼或丟失的問題,因為gbk編碼范圍與uft8編碼范圍的問題,下面我們簡單的列了一個gbk與utf8編碼范圍表,看了就知道原因了。
一、編碼范圍
1. GBK (GB2312/GB18030)
x00-xff GBK雙字節編碼范圍
x20-x7f ASCII
xa1-xff 中文
x80-xff 中文
2. UTF-8 (Unicode)
u4e00-u9fa5 (中文)
x3130-x318F (韓文
xAC00-xD7A3 (韓文)
u0800-u4e00 (日文)
ps: 韓文是大於[u9fa5]的字符
例
代碼如下 復制代碼$c = '測試•字符傳換•五一快樂!';
echo iconv('utf-8', 'gbk',$c);
只會輸出: 測試 後出全會丟失"."
解決方法:
加 //IGNORE
代碼如下 復制代碼$c = '測試•字符傳換•五一快樂!';
echo iconv('utf-8', 'gbk//IGNORE',$c);
輸入出:測試字符傳換五一快樂!
例2
代碼如下 復制代碼 <?php