mysql的字符集支持(character set support)有兩個方面:字符集(character set)和排序方式(collation)。對於字符集的支持細化到四個層次:
服務器(server),數據庫(database),數據表(table)和連接(connection)。
1.mysql默認字符集:mysql對於字符集的指定可以細化到一個數據庫,一張表,一列.傳統的程序在創建數據庫和數據表時並沒有使用那麼復雜的配置,它們用的是默認的配置. (1)編譯mysql 時,指定了一個默認的字符集,這個字符集是 latin1;
(2)安裝mysql 時,可以在配置文件 (my.ini) 中指定一個默認的的字符集,如果沒指定,這個值繼承自編譯時指定的;
(3)啟動mysqld 時,可以在命令行參數中指定一個默認的的字符集,如果沒指定,這個值繼承自配置文件中的配置,此時 character_set_server 被設定為這個默認的字符集;
(4)當創建一個新的數據庫時,除非明確指定,這個數據庫的字符集被缺省設定為character_set_server;
(5)當選定了一個數據庫時,character_set_database 被設定為這個數據庫默認的字符集;
(6)在這個數據庫裡創建一張表時,表默認的字符集被設定為 character_set_database,也就是這個數據庫默認的字符集;
(7)當在表內設置一欄時,除非明確指定,否則此欄缺省的字符集就是表默認的字符集;如果什麼地方都不修改,那麼所有的數據庫的所有表的所有欄位的都用 latin1 存儲,不過我們如果安裝 mysql,一般都會選擇多語言支持,也就是說,安裝程序會自動在配置文件中把 default_character_set 設置為 utf-8,這保證了缺省情況下,所有的數據庫的所有表的所有欄位的都用 utf-8 存儲。
2.查看默認字符集(默認情況下,mysql的字符集是latin1(iso_8859_1)通常,查看系統的字符集和排序方式的設定可以通過下面的兩條命令:
mysql> show variables like 'character%';
+--------------------------+---------------------------------+
| variable_name | value |
+--------------------------+---------------------------------+
| character_set_client | latin1 |
| character_set_connection | latin1 |
| character_set_database | latin1 |
| character_set_filesystem | binary |
| character_set_results | latin1 |
| character_set_server | latin1 |
| character_set_system | utf8 |
| character_sets_dir | d:"mysql-5.0.37"share"charsets" |
+--------------------------+---------------------------------+
mysql> show variables like 'collation_%';
+----------------------+-----------------+
| variable_name | value |
+----------------------+-----------------+
| collation_connection | utf8_general_ci |
| collation_database | utf8_general_ci |
| collation_server | utf8_general_ci |
+----------------------+-----------------+
3.修改默認字符集
(1) 最簡單的修改方法,就是修改mysql的my.ini文件中的字符集鍵值,
如 default-character-set = utf8
character_set_server = utf8
修改完後,重啟mysql的服務,service mysql restart
使用 mysql> show variables like 'character%';查看,發現數據庫編碼均已改成utf8
+--------------------------+---------------------------------+
| variable_name | value |
+--------------------------+---------------------------------+
| character_set_client | utf8 |
| character_set_connection | utf8 |
| character_set_database | utf8 |
| character_set_filesystem | binary |
| character_set_results | utf8 |
| character_set_server | utf8 |
| character_set_system | utf8 |
| character_sets_dir | d:"mysql-5.0.37"share"charsets" |
+--------------------------+---------------------------------+
(2) 還有一種修改字符集的方法,就是使用mysql的命令
set character_set_client = utf8 ;
set character_set_connection = utf8 ;
set character_set_database = utf8 ;
set character_set_results = utf8 ;
set character_set_server = utf8 ;
mysql> set collation_connection = utf8 ;
mysql> set collation_database = utf8 ;
mysql> set collation_server = utf8 ;
一般就算設置了表的默認字符集為utf8並且通過utf-8編碼發送查詢,你會發現存入數據庫的仍然是亂碼。問題就出在這個connection連接層上。解決方法是在發送查詢前執行一下下面這句:
set names 'utf8';
它相當於下面的三句指令:
set character_set_client = utf8;
set character_set_results = utf8;
set character_set_connection = utf8;
不知道什麼原因,我在自己機器上把上述三個字符集都設置成utf8後,查詢中文結果還是亂碼,只有把character_set_results設置成gbk之後才能從命令行正常顯示中文.
set character_set_results=gbk;