從MySQL 4.1開始引入多語言的支持,但是用PHP插入的中文會出現亂碼.無論用什麼編碼也不行.
解決這個問題其實很簡單.
1.在建表的時候設置編碼類型為gb2312_chinese_ci.
2.在PHP頁面的數據庫連接語句加一行mysql_query("SET NAMES 'gb2312'",$link); 例如
$db_host="localhost";
$db_user="root";
$db_password="password";
$db_name="test";
$link=mysql_connect($db_host,$db_user,$db_password);
mysql_query("SET NAMES 'gb2312'",$link);
$db=mysql_select_db($db_name,$link);
$query="select * from user";
$result=mysql_query($query);
寫入頁面和讀取頁面都加入這行.這樣在MYSQL裡面的中文就能正常顯示了.
相關資料:
從MySQL 4.1開始引入多語言的支持,而且一些特性已經超過了其他的數據庫系統。
MySQL4.1的字符集支持(Character Set
Support)有兩個方面:字符集(Characterset)和排序方式(Collation)。對於字符集的支持細化到四個層次:服務器
(server),數據庫(database),數據表(table)和連接(connection)。
查看系統的字符集和排序方式的設定可以通過下面的兩條命令:!
mysql> show variables like 'character_set_%';
+--------------------------+----------------------------+
| Variable_name | Value |
+--------------------------+----------------------------+
| character_set_client | latin1 |
| character_set_connection | latin1 |
| character_set_database | latin1 |
| character_set_results | latin1 |
| character_set_server | latin1 |
| character_set_system | utf8 |
| character_sets_dir | /usr/share/mysql/charsets/ |
+--------------------------+----------------------------+
7 rows in set (0.00 sec)
mysql> show variables like 'collation_%';
+----------------------+-------------------+
| Variable_name | Value |
+----------------------+-------------------+
| collation_connection | latin1_swedish_ci |
| collation_database | latin1_swedish_ci |
| collation_server | latin1_swedish_ci |
+----------------------+-------------------+
3 rows in set (0.00 sec)
上面列出的值就是系統的默認值。(很奇怪系統怎麼默認是latin1的瑞典語排序方式)...
當我們按照原來的方式通過PHP存取MySQL數據庫時,就算設置了表的默認字符集為utf8並且通過UTF-8編碼發送查詢,你會發現存入數據庫的仍然是亂碼。問題就出在這個connection連接層上。解決方法是在發送查詢前執行一下下面這句:
set names 'utf8';
它相當於下面的四句指令:
set character_set_client = utf8;
set character_set_results = utf8;
set character_set_connection = utf8;
set collation_connection = utf8_general_ci
由於默認網頁提交的查詢是gb2312(表單頁面meta裡可以看到),而mysql默認將其當作utf8(可以查到此時的
character_set_client=utf8),所以必然亂碼。同理,mysql返回的結果是已經轉換成
character_set_results編碼的(與表的編碼無關),同樣默認是utf8,而網頁頁面把它當gb2312處理,所以必然有標題等由數據
庫讀出的字段是亂碼而其他php部分文字不亂碼的現象。
解決(by 一劍飄雪):
安裝mysql5.0時要選utf8字符集(在用phpmyadmin創建數據庫和字段時就不需要在整理中選utf8字符集了),並在php建立連接後發送
$link = mysql_connect('localhost', 'root', 'root');
mysql_query("SET NAMES 'utf8'",$link);
這時我們在網頁中看到的還是亂碼但已不是????了,查看網頁源文件,已完全正常。用記事本打開php源文件,別存為utf8編碼,再刷新網頁,全部搞定了。
或者,當然還是要安裝時仍要utf8安裝,在php中發送set names 'gb2312',同時php文件存為記事本默認的ansi,也能正確顯示中文.
但總不能每次連接時都發送一次SET NAMES 'utf8'吧,如何徹底解決還沒找到方法。
這樣安裝mysql時缺省字符集選為utf8後又帶來一個問題,我們在command.exe中進入mysql控制台後,查詢結果又成了亂碼,我們可以在查詢前輸入
mysql>set names 'gbk';
或
mysql>set names 'gb2312';
相當於告訴mysql客戶端在使用gb2312字符集,結果就正確了,gb2312為GBK的子集.