程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> 關於PHP編程 >> 解決PHP中file_get_contents抓取網頁中文亂碼問題

解決PHP中file_get_contents抓取網頁中文亂碼問題

編輯:關於PHP編程

根據網上有朋友介紹說原因可能是服務器開了GZIP壓縮。

下面是用firebug查看我的博客的頭信息,Gzip是開了的。

請求頭信息原始頭信息

 代碼如下 復制代碼
Accept text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Encoding gzip, deflate
Accept-Language zh-cn,zh;q=0.8,en-us;q=0.5,en;q=0.3
Connection keep-alive
Cookie __utma=225240837.787252530.1317310581.1335406161.1335411401.1537; __utmz=225240837.1326850415.887.3.utmcsr=google|utmccn=(organic)|utmcmd=organic|utmctr=%E4%BB%BB%E4%BD%95%E9%A1%B9%E7%9B%AE%E9%83%BD%E4%B8%8D%E4%BC%9A%E9%82%A3%E4%B9%88%E7%AE%80%E5%8D%95%20site%3Awww.nowamagic.net; PHPSESSID=888mj4425p8s0m7s0frre3ovc7; __utmc=225240837; __utmb=225240837.1.10.1335411401
Host www.111cn.net
User-Agent Mozilla/5.0 (Windows NT 5.1; rv:12.0) Gecko/20100101 Firefox/12.0
 


可以從header信息中找到 Content-Encoding 項是 Gzip 。

解決辦法比較簡單。

就是用 curl 代替 file_get_contents 去獲取,然後在 curl 配置參數中加一條

 代碼如下 復制代碼
curl_setopt($ch, CURLOPT_ENCODING, "gzip");
 

今天用 file_get_contents 抓圖片的時候,開始沒發現這個問題,廢了老大勁才找出來

1. 使用自帶的zlib庫

如果服務器已經裝了zlib庫,用下面的代碼可以輕易解決亂碼問題。

 代碼如下 復制代碼
$data = file_get_contents("compress.zlib://".$url);
 

當然也可以使用curl模塊來解決人我的問題這裡我給各位推薦一文章,如下你感興趣的文章

更多詳細內容請查看:http://www.111cn.net/phper/31/58895.htm

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved