最近寫了一個抓取腳本,抓取的大部分內容正常,但少部分亂碼
檢測字符編碼,得出的結果是CP936
mb_detect_encoding($str, 'GBK, gb2312, GB18030, ISO-8859-1, ASCII, UTF-8', true)
嘗試轉換此編碼,但得出的結果還是亂碼
mb_convert_encoding($str, 'UTF-8', 'CP936'); 氓聧擄氓潞婁盲賂聙70氓虜聛貓聙聛氓隴麓莽聦樓盲潞碌7氓虜聛氓樓魯氓顱漏貓聙聦貓壟蘆忙聧聲
最後發現,這樣可以轉碼
iconv('utf-8', 'latin1', $str);
iconv('utf-8','latin1//IGNORE', $str);