為什麼在ASP裡指定了codepage為65001還經常顯示亂碼.才子在這裡將這個問題詳細解釋一下,以免很多朋友再走彎路,甚至排斥UTF-8.
如果你還不知道UTF-8是什麼東東,那才子建議你先去搜索一下UTF-8的相關資料吧.
UTF-8編碼之所以被越來越多的人接受甚至喜歡,肯定是有道理的,在WEB2.0盛行的今天,在大談多浏覽器兼容的同時,不得不想到字符編碼不同所造成的亂碼現象同樣需要得到很好的處理.....
在N年以前,IE6以下的所有版本,只要沒有安裝相應的字庫,訪問相關的頁面都是會亂碼的,例如,我是IE5 (Windows2000默認) 的版本,在沒有安裝IE繁體字庫的情況下,訪問任何繁體頁面的網站都是會亂碼的,當然前提是該頁面采用了BIG5的Charset,而UTF-8作為一種國際編碼就能很好的處理該問題,只要將頁面存為UTF-8編碼格式,再在頁面上將codepage及charset全部定義為utf-8就可以在任何客戶端浏覽器中顯示出完全正確的內容,完全不會亂碼......
好了,才子這裡以ASP頁面為例,以一個實例來看具體操作吧:
在這才子推薦用Editplus來寫代碼,才子也專門寫過一篇Editplus的使用教程,有興趣的朋友可以 點擊這裡 去看看.
打開新建一個ASP頁面,相信玩ASP的朋友都會留意到,許多下載的源碼裡,頁面最上方一般都有一句:
<%@LANGUAGE="VBSCRIPT" CODEPAGE="936"%>
前面的language應該不用多說了,vbscript就是ASP默認的腳本語言,其實完全可以不用寫,寫了好像還會影響頁面執行效率,在這裡我們先不討論這個問題. 後面的codepage就是關鍵了,目的就是告訴浏覽器,此頁面是何種編碼,936代表是簡體中文,而950代表繁體中文,65001就是我們今天說的UTF-8編碼了.我們將936改成65001,整句如下:
<%@LANGUAGE="VBSCRIPT" CODEPAGE="65001"%>
再加上輸出幾個中文字看看能不能正確顯示吧.
<%
Response.Write "第一次測試UTF-8頁面"
%>
OK,直接點擊"保存",執行這個頁面看看,如果不出意外,大家可能看到顯示出的是 "一尾UTF-8頁" 這幾個字,中文有亂碼的現象,什麼原因呢?
OK,請大家再點擊最上面的 "文件" 菜單,選擇"另存為",最下面一行有個編碼,默認應該是ANSI的,請大家點下拉框,選擇UTF-8,再點保存,再執行試試看,如果不出意外,亂得更厲害了,呵呵,暈了吧.別急,想想原因,因為我們做的頁面是HTML返回的,以前我們寫HTML時,看到body前面,也就是head裡都有一句meta,應該是這樣的:
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
也就是指定頁面以gb2312編碼返回結果,一定要寫在有返回結果輸出的前面.大家都知道gb2312是簡體中文吧,我們今天說的是UTF-8編碼,我們就將gb2312改成UTF-8吧,全部代碼如下:
<%@LANGUAGE="VBSCRIPT" CODEPAGE="65001"%>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<%
Response.Write "第一次測試UTF-8頁面"
%>
再執行看看,嗯,這次正常顯示了吧.......
結論:采用UTF-8編碼,除了要將文件另存為UTF-8格式之外,還需要同時指定codepage及charset.