用到iconv函數把抓取來過的utf-8編碼的頁面轉成gb2312, 發現只有用iconv函數把抓取過來的數據一轉碼數據就會無緣無故的少一些 代碼如下 復制代碼
<?php
echo $str= '你好,這裡是賣咖啡!';
echo '<br />';
echo iconv('GB2312', 'UTF-8', $str); //將字符串的編碼從GB2312轉到UTF-8
echo '<br />';
echo iconv_substr($str, 1, 1, 'UTF-8'); //按字符個數截取而非字節
print_r(iconv_get_encoding()); //得到當前頁面編碼信息
echo iconv_strlen($str, 'UTF-8'); //得到設定編碼的字符串長度
//也有這樣用的
$content = iconv("UTF-8","gbk//TRANSLIT",$content);
?>
iconv(“UTF-8″,”GB2312//IGNORE”,$data)
ignore的意思是忽略轉換時的錯誤,如果沒有ignore參數,所有該字符後面的字符串都無法被保存。
這個iconv()這個函數,在php5中是內置的.