最近在解析淘寶中商品的信息,結果出現亂碼,如:
原因就是中文字符格式出現沖突,ASP.NET MVC 默認采用utf-8,但是淘寶網頁采用gbk。
在網上找了一下,最常用的解決方法就是修改web.config:
< system.web> ...... < globalization requestEncoding="gbk" responseEncoding="gbk" culture="zh-CN" fileEncoding="gbk" /> ...... < /system.web>
結果依然不行。
想到我是從HTML文件中讀取數據,於是就在讀取的同時指定中文格式,像是這樣:
var reader = new StreamReader(File.OpenRead(@"C:\Users\Administrator\Documents\Visual Studio 2012\Projects\TaoBaoShop\TaoBaoShop\taobao.html"), System.Text.Encoding.GetEncoding("gbk"))
問題解決了,像是這樣:
如果大家也有同樣的問題,可以嘗試我的做法。