程式師世界 >> 編程語言 >> 網頁編程 >> JSP編程 >> 關於JSP >> jsp或java亂碼

jsp或java亂碼

編輯：關於JSP

今天我又被JSP亂碼問題撞了一下腰，特把該問題處理方案整理如下：

1、TOMCAT6.0.33配置文件server.xml沒有URIEncoding="utf-8"

URL有中文字符串，後台用java，采用流行作法，

String str = request.getParameter("hello");

System.out.println(str);

結果亂碼，改為

System.out.println(new String(str.getBytes("iso-8859-1"),"UTF-8"));

結果正常。

2、TOMCAT配置文件server.xml有URIEncoding="utf-8"，形如：

    <Connector port="8080" protocol="HTTP/1.1"
               connectionTimeout="20000"
               redirectPort="8443" URIEncoding="utf-8"/>
URL有中文字符串，後台用java，采用流行作法，

String str = request.getParameter("hello");

System.out.println(new String(str.getBytes("iso-8859-1"),"UTF-8"));

也是亂碼，原因很簡單，由於容器已經指定URIEncoding="utf-8"，勿需再轉換！！！

改為System.out.println(str);結果即可正常。

3、無論字符原來用何種本地字符集表示，在Unicode字符集中都被表示成相同的編碼。或者說，Unicode字符集和語言的種類無關。
使用兩次編碼的過程相當於如下代碼：

            String name=java.net.URLEncoder.encode("測試", "UTF-8");
            System.out.println(name);
            name=java.net.URLEncoder.encode(name,"UTF-8");
            System.out.println(name);
            name=java.net.URLDecoder.decode(name, "UTF-8");
            System.out.println(name);
            System.out.println(java.net.URLDecoder.decode(name, "UTF-8"));
輸出為：

            %E6%B5%8B%E8%AF%95
            %25E6%25B5%258B%25E8%25AF%2595
            %E6%B5%8B%E8%AF%95
            測試

第一次編碼後將漢字編碼為%和字母數字的格式，而第二次編碼的時候是對%字母數字進行編碼，雖然解碼的時候使用的是ISO-8859-1，但是對於%和字母數字而言用ISO-8859-1和UTF-8解碼出來的是一樣的，此時就回到了漢字被編碼過一次的字符串了，當再次進行解碼的時候使用UTF-8就回將它轉會漢字。

摘自鳴志工作室