在jsp中,中文亂碼常會讓人心亂如麻。
對於中文處理的常見對策,在網上經常可見的主要是下面2種:
<%@ page
contentType="text/html;charset=gb2312" %>
或者:
<%
String Hi="你好";
byte[]
tmpbyte=Hi.getBytes("ISO8859_1");
Hi=new
String(tmpbyte);
out.print(Hi);
%>
虛擬小龍亭也主要采用了上面2種方法進行了修改,從而變成了1.1版。
通過簡單總結,示例中的中文處理發生於以下幾個地方:
1 在url附帶中文參數,可以直接讀取。
例如:
<%= request.getParameter("showword")%>
2 與數據庫有關的各種sql操作
這裡使用的Access沒有發生問題。
3 讀取HTML
form表單中遞交的中文值
在jswdk中需要加以編碼,較為簡潔的寫法如:
String name1=new
String(request.getParameter("user_id").getBytes("ISO8859_1"));
另外,在jdk1.3的支持下,不需要加入
<%@
page contentType="text/html;charset=gb2312"
%>
而在jdk1.2.2下面,即使2種方法同時運用也很不穩定。
而在resin平台,情況較好。只要在頁面第一行加入:
<%@
page contentType="text/html;charset=gb2312"
%>
即可正確處理中文。
如果再加編碼則反而不對。
5 session中包含的中文
在jswdk中,奇怪的是如果從form中讀出的值經過編碼則可正確顯示;
但直接賦予中文值則不行。
resin平台很好,同上。
6 對於對變量賦中文值後正確顯示中文。
例如以下程序:
<%@ page contentType="text/html;charset=gb2312"
%>
<html><head></head><body>
<%
String
Hi="你好";
byte[] tmpbyte=Hi.getBytes("ISO8859_1");
Hi=new
String(tmpbyte);
out.print(Hi);
%>
</body></html>
同樣是jswdk1.0.1,以上的表示方法在jdk1.2.2中沒有問題,但在jdk1.3下卻無法顯示。
resin平台很好,同上,經過測試,只需要在<head>中補上
<meta
http-equiv="Content-Type" content="text/html;
charset=gb2312">
而不需要<%@ page
contentType="text/html;charset=gb2312" %>也能正確顯示中文。
體會:
jswdk也許只能用於普通開發,穩定性和其它問題可能不如商業軟件。
由於jdk1.3版性能要好於jdk1.2.2很多倍,並且對中文的支持也較好,所以應該加以采用。
作為免費的商業軟件,resin不僅速度快,穩定,自動編譯,可指出出錯行,可在服務器端支持使用javascript等,而且,至少我覺得對中文的支持很好。
當然,如果不必做任何處理即可正確顯示中文將是我們所期待的。
另外,相信在unix/linux/solaris下應該沒有這樣的問題。