以下的文章主要是對MySQL數據庫編碼的相關問題的全面解析,我們大家都知道Mysql數據庫的4.1可以作為一個分水嶺,其直接支持的是Unicode,以下的相關版本支持的不是很好。以下就是文章的詳細內容。
我們大家都知道Mysql JDBC Driver的3.0.16是一個分水嶺,3.0.16版本會取數據庫本身的MySQL數據庫編碼,然後按照該編碼轉換,這種方式和Oracle的JDBC Driver是一樣的。例如你的數據庫是GBK編碼的話,JDBC Driver就會把數據庫裡面的取出來的字符串按照GBK往unicode轉換,送給JVM。因此正確的設置數據庫本身的編碼就尤為重要。
Mysql JDBC Driver3.0.16以下的版本則不然,它不會那麼智能的根據數據庫編碼來確定如何轉換,它總是默認使用ISO8859-1,因此你必須使用 characterEncoding=GBK來強制他把數據庫中取出來的字符串按照GBK來往unicode轉換。
因此,使用什麼數據庫版本,不管是3.x,還是4.0.x還是4.1.x,其實對我們來說不重要,重要的有二:
1) 正確的設定數據庫編碼,Mysql4.0以下版本的字符集總是默認ISO8859-1,Mysql4.1在安裝的時候會讓你選擇。如果你准備使用UTF- 8,那麼在創建數據庫的時候就要指定好UTF-8(創建好以後也可以改,4.1以上版本還可以單獨指定表的字符集)
2) 使用3.0.16以上版本的JDBC Driver,那麼你就不需要再寫什麼characterEncoding=UTF-8
這樣,如果,數據庫服務器使用的是utf-8,那麼,jdbc就會把數據庫的內容用utf-8格式傳到JVM中。
而,如果數據庫服務器中的某個數據庫使用的編碼是gbk,那麼就會發生MySQL數據庫編碼不一致的錯誤!這時,你可以使?characterEncoding=GBK強制使用gbk編碼傳遞到JVM中。
或者,你也可以把整個Mysql數據庫服務器的編碼轉變為gbk。
在Mysql中,默認使用的是lartin1,也就是ISO8859-1字符集編碼。這是一種8位的編碼,適用於所有西歐字符。而對於漢字等是不合適的。
最好、最通用的編碼格式是utf-8,這時一種8位的Unicode字符集。它對於8位的西歐字符集來說,比較節省空間,而又能夠有效地表示漢字等字符。
因此,將Mysql數據庫服務器設置為utf-8格式,把所有的Mysql數據庫也設置為utf-8格式,這是最佳的選擇!全世界所有語言都可以很好的得到支持!
但是,一些常用的Mysql工具無法顯示utf-8格式的中文。如,Mysql自帶的工具,Mysql-Front等軟件。但是,MyManger和命令行下的Mysql是可以正常顯示utf-8格式的中文的。
如果,你選擇使用gbk,那麼就應該把數據庫服務器和數據庫的MySQL數據庫編碼格式全部轉為使用gbk,否則可能會出現問題。