突然發現我的數據表中,有漢字的部分均是亂碼,英文正常,遂懷疑是編碼問題。同事的工作,使用http發送utf-8編碼的漢字,服務器程序可正確接收和存入數據庫,讀取,均正確。
數據表配置為utf-8
一開始以為本地語言編碼格式問題,對字符串進行編碼,如;
string str = "漢字編碼";
byte[] bytes = Encoding.UTF8.GetBytes(str);
string newstr = Encoding.UTF8.GetString(bytes);
之後調試無用。
後在數據庫連接時,添加:
MySQLCommand setformat = new MySQLCommand("set names gb2312",m_Connection);
setformat.ExecuteNonQuery();
setformat.Dispose();
搞定。
一開始不清楚為什麼,因為整個數據庫的默認配置都是utf-8,而且同事在使用http協議傳送utf-8的漢字時,是正確的執行了的。
於是找 set names XX命令的解釋,發現一篇說的比較明白的,轉載了。
近來接受BBT的培訓,做一個投票系統。系統代碼倒不是很難,但是我的時間主要花費在了研究字符集和編碼上面。MySQL和Apache兩個系統的編碼(字符集)問題讓我費勁腦筋,吃盡苦頭。網上對這些問題的解決比較零散,比較片面,大部分是提供解決方法,卻不說為什麼。於是我將這幾天收獲總結一下,避免後來者再走彎路。這篇文章對PHP編寫有一點幫助(看完你就知道,怎樣讓你的PHP程序在大部分空間提供商的服務器裡顯示正常),但是更多幫助在於網絡服務器的架設和設置。
先說MySQL的字符集問題。Windows下可通過修改my.ini內的[code]# CLIENT SECTION
[mysql]
default-character-set=utf8
# SERVER SECTION
[mysqld]
default-character-set=utf8[/code]這兩個字段來更改數據庫的默認字符集。第一個是客戶端默認的字符集,第二個是服務器端默認的字符集。假設我們把兩個都設為utf8,然後在MySQL Command Line Client裡面輸入“show variebles like“character_set_%”;”,可看到如下字符:
character_set_client latin1
character_set_connection latin1
character_set_database utf8
character_set_results latin1
character_set_server utf8
character_set_system utf8
其中的utf8隨著我們上面的設置而改動。此時,要是我們通過采用UTF-8的PHP程序從數據庫裡讀取數據,很有可能是一串“?????”或者是其他亂碼。網上查了半天,解決辦法倒是簡單,在連接數據庫之後,讀取數據之前,先執行一項查詢“SET NAMES UTF8”,即在PHP裡為[code]mysql_query("SET NAMES UTF8");[/code]即可顯示正常(只要數據庫裡信息的字符正常)。為什麼會這樣?這句查詢“SET NAMES UTF8”到底是什麼作用?
到MySQL命令行輸入“SET NAMES UTF8;”,然後執行“show variebles like“character_set_%”;”,發現原來為latin1的那些變量“character_set_client”、“character_set_connection”、“character_set_results”的值全部變為utf8了,原來是這3個變量在搗蛋。查閱手冊,上面那句等於:[code]SET character_set_client = utf8;
SET character_set_results = utf8;
SET character_set_connection = utf8;[/code]看看這3個變量的作用:
信息輸入路徑:client→connection→server;
信息輸出路徑:server→connection→results。
換句話說,每個路徑要經過3次改變字符集編碼。以出現亂碼的輸出為例,server裡utf8的數據,傳入connection轉為latin1,傳入results轉為latin1,utf-8頁面又把results轉過來。如果兩種字符集不兼容,比如latin1和utf8,轉化過程就為不可逆的,破壞性的。所以就轉不回來了。
但這裡要聲明一點,“SET NAMES UTF8”作用只是臨時的,MySQL重啟後就恢復默認了。
接下來就說到MySQL在服務器上的配置問題了。豈不是我們每次對數據庫讀寫都得加上“SET NAMESUTF8”,以保證數據傳輸的編碼一致?能不能通過配置MySQL來達到那三個變量默認就為我們要想的字符集?手冊上沒說,我在網上也沒找到答案。所以,從服務器配置的角度而言,是沒辦法省略掉那行代碼的。
總結:為了讓你的網頁能在更多的服務器上正常地顯示,還是加上“SET NAMES UTF8”吧,即使你現在沒有加上這句也能正常訪問。