程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 數據庫知識 >> MYSQL數據庫 >> MYSQL入門知識 >> 了解MySQL的字符集

了解MySQL的字符集

編輯:MYSQL入門知識

在數據庫中,字符亂碼屬於常見、多發問題。鑒於本人水平頂多只能歸於不入流之類,寫這篇文章時內心誠惶誠恐,實在擔心誤導大家。內容僅供參考,若有錯誤,請各位及時指出,我也好學習提高!

MySQL的字符集有4種級別的設置,分別是:服務器級、數據庫級、表級、字段級。

一、服務器級字符集

(1)、可以在my.cnf中設置

[mysqld]
default-character-set=gbk (5.1)
character-set-server=gbk (5.5)

(2)、可以在啟動選項中設置

mysqld --default-character-set=gbk

(3)、可以在編譯的時候設置

./configure --with-charset=gbk
          或
cmake . -default-charset=gbk

如果沒有指定服務器的字符集,默認使用latin1為服務器的字符集。

(4)、查看當前服務器的字符集

mysql> show variables like '%char%';
+--------------------------+-----------------------------------------+
| Variable_name            | Value                                   |
+--------------------------+-----------------------------------------+
| character_set_client     | latin1                                  |
| character_set_connection | latin1                                  |
| character_set_database   | latin1                                  |
| character_set_filesystem | binary                                  |
| character_set_results    | latin1                                  |
| character_set_server     | latin1                                  |
| character_set_system     | utf8                                    |
| character_sets_dir       | /usr/local/mysql-5.6.28/share/charsets/ |
+--------------------------+-----------------------------------------+

二、數據庫字符集

數據庫的字符集在創建數據庫的時候指定,也可以在創建完數據庫之後通過alter database語句修改。如果數據庫中已經存在數據,修改數據庫字符集並不能將已有的數據按新字符集存放。所以無法通過修改數據庫字符集修改數據的內容。

設置數據庫字符集的規則:

(1)、如果指定了字符集和校對規則,則使用指定的規則;

(2)、如果僅指定字符集而沒有指定校對規則,則使用指定的字符集和默認的校對規則;

(3)、如果沒有指定字符集和校對規則,則使用服務器的字符集和校對規;

三、表字符集

表的字符集是在建表的時候指定的,可以通過alter table語句進行修改。同樣,對於表中已經存在的數據,修改字符集不會影響原有的記錄,仍將使用原有的字符集。

設置表的字符集的規則同設置數據庫的字符集規則。

四、列字符集

列的字符集和校對規則可以在建表的時候指定,也可以在修改表的時候調整。(這個不常用,僅記錄一下)

五、SET NAMES命令

除了上述的四種字符集外,對實際的應用訪問來說,還存在客戶端和服務端之間交互的字符集,如下:

(1)、character_set_client:客戶端字符集
(2)、character_set_connection:連接字符集
(3)、character_set_resluts:結果字符集

通常情況下,這3個字符集都應該是相同的,才能保證用戶寫入的數據被正確的讀出,特別是對於中文字符。

set names命令則用於同時修改這3個參數的值。

六、關於中文字符集插入的實驗

字符集不一致是導致數據庫內中文內容亂碼的罪魁禍首。

實驗環境:

Server version: 5.6.28 (在此說明實驗環境是由於在學習過程中,從網上參考了部分資料,實驗過程與資料描述稍有出入,未查出原因,只能暫歸結為版本不同所致。)

實驗對象:

mysql> show create table char_test\G 
*************************** 1. row ***************************
       Table: char_test
Create Table: CREATE TABLE `char_test` (
  `id` smallint(6) NOT NULL AUTO_INCREMENT,
  `name` char(20) NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=3 DEFAULT CHARSET=latin1
1 row in set (0.00 sec)

由上可知,char_test表的字符集是latin1,如果不設置正確的字符集,插入中文字符時,必然會出現如下錯誤:

mysql> insert into char_test (name) values ('小王');
ERROR 1366 (HY000): Incorrect string value: '\xE5\xB0\x8F\xE7\x8E\x8B' for column 'name' at row 1

 

解決方案

(1)、先set names latin1,然後再插入數據。

mysql> set names latin1;
Query OK, 0 rows affected (0.00 sec)

mysql> insert into char_test (name) values ('小王');
Query OK, 1 row affected (0.01 sec)

mysql> select * from char_test;
+----+--------+
| id | name   |
+----+--------+
|  1 | Tom    |
|  2 | 小明   |
|  3 | 小王   |
+----+--------+
3 rows in set (0.00 sec)

(2)、在data.sql文件中指定set names latin1,然後通過source命令導入data.sql。

# vi data.sql
set names latin1;
insert into char_test (name) values ('小李');

mysql> source data.sql
Query OK, 1 row affected (0.00 sec)

mysql> select * from char_test;
+----+--------+
| id | name   |
+----+--------+
|  1 | Tom    |
|  2 | 小明   |
|  3 | 小王   |
|  4 | 小李   |
+----+--------+
4 rows in set (0.00 sec)

(3)、在data.sql文件中指定set names latin1,然後通過mysql命令導入

# vi data.sql
set names latin1;
insert into char_test (name) values ('小張');

# mysql -uroot -p test1 < data.sql
# mysql -uroot -p -e "set names latin1;select * from test1.char_test;"

(4)、通過指定mysql命令的字符集參數實現 --default-charset-set=字符集

# vi data.sql
insert into char_test (name) values ('小張');

# 錯誤方法
# mysql -uroot -p  test1 < data.sql                      
Enter password: ******
ERROR 1366 (HY000) at line 1: Incorrect string value: '\xE5\xB0\x8F\xE8\xB5\xB5' for column 'name' at row 1

# 正確方法
# mysql -uroot -p  --default-character-set=latin1 test1 < data.sql 
Enter password: ******

# mysql -uroot -p -e "set names latin1;select * from test1.char_test;"
Enter password: ******
+----+--------+
| id | name   |
+----+--------+
|  1 | Tom    |
|  2 | 小明   |
|  3 | 小王   |
|  4 | 小李   |
|  5 | 小張   |
|  6 | 小趙   |
+----+--------+

(5)、在配置文件中指定客戶端的字符集

vi my.cnf
[client]
default-character-set=latin1

mysql> insert into char_test (name) values ('小馬');
Query OK, 1 row affected (0.00 sec)

mysql> select * from char_test;
+----+--------+
| id | name   |
+----+--------+
|  1 | Tom    |
|  2 | 小明   |
|  3 | 小王   |
|  4 | 小李   |
|  5 | 小張   |
|  6 | 小趙   |
|  7 | 小馬   |
+----+--------+
7 rows in set (0.00 sec)
  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved