MySQL collation辦法。本站提示廣大學習愛好者:(MySQL collation辦法)文章只能為提供參考,不一定能成為您想要的結果。以下是MySQL collation辦法正文
成績是如許的:
一張test的表,字符集采取的latin1。
select to_id from test where to_id='cn象_王';
+---------------+
| to_id |
+---------------+
| cn陶_陶 |
| cn象_王 |
+---------------+
2 rows in set (0.00 sec)
取cn象_王的數據,竟然把cn陶_陶的數據也取回來了。
這明顯是不許可的。
檢查它們的編碼:
(root@im_offlog1a)[test]> select hex('cn陶_陶');
+----------------+
| hex('cn陶_陶') |
+----------------+
| 636ECCD55FCCD5 |
+----------------+
1 row in set (0.00 sec)
(root@im_offlog1a)[test]> select hex('cn象_王');
+----------------+
| hex('cn象_王') |
+----------------+
| 636ECFF35FCDF5 |
+----------------+
1 row in set (0.00 sec)
編碼切實其實是紛歧樣的,然則為何mysql會以為這兩筆記錄是一樣的呢?
一開端我們就把成績定位於collation惹起的成績。
show variables檢查
| collation_connection | latin1_swedish_ci
| collation_database | latin1_swedish_ci
| collation_server | latin1_swedish_ci
手工把這些參數修正為latin1_bin,成果竟然一樣。這下感到真是奇異了。
這裡先說明一下mysql collation的定名規矩:
它們以其相干的字符集名開端,平日包含一個說話名,而且以_ci(年夜小寫不敏感)、_cs(年夜小寫敏感)或_bin(二元)停止
好比latin1字符集有以下幾種校訂規矩:
校訂規矩 寄義
latin1_german1_ci 德國DIN-1
latin1_swedish_ci 瑞典/芬蘭
latin1_danish_ci 丹麥/挪威
latin1_german2_ci 德國 DIN-2
latin1_bin 相符latin1編碼的二進制
latin1_general_ci 多種說話(西歐)
latin1_general_cs 多種說話(西歐ISO),年夜小寫敏感
latin1_spanish_ci 古代西班牙
最初我們將表格重建,手工指定表格級其余collation為latin1_bin。
這個成績就獲得懂得決。
那末成績又來了,為何我後面手工測試latin1_bin時不失效呢?
本來MySQL依照上面的方法選擇表字符集和 校訂規矩:
假如指定了CHARACTER SET X和COLLATE Y,那末采取CHARACTER SET X和COLLATE Y。
假如指定了CHARACTER SET X而沒有指定COLLATE Y,那末采取CHARACTER SET X和CHARACTER SET X的默許校訂規矩。
不然,采取辦事器字符集和辦事器校訂規矩。
而我們在建表的時刻指定了character set,所以它永久是采取對應的默許的校訂規矩。
固然我們其實也沒需要重建表格,只須要alter table db_allot CONVERT TO CHARACTER SET latin1 COLLATE latin1_bin如許轉換便可。
別的建議collation都盡可能采取字符集響應的bin類型的校訂規矩,如許不輕易失足。
再說說我本身的領會
認為 character set latin1 collate latin1_bin 就是老版的 VARCHAR BINARY 的改良,只是新版的先用 character set 定字符集,再用此字符集名字加 _bin 定校訂規矩為二進制的,從而確保中文查詢准確。
再測試了一下,把此字段屬性改成不帶 BINARY 的
ALTER TABLE `comment_content_1_01` CHANGE `thread` `thread` VARCHAR( 50 ) DEFAULT NULL
然後再看表構造確切釀成 `thread` varchar(50) default NULL, 即不帶 character set latin1 collate latin1_bin 了,可見character set latin1 collate latin1_bin 就是老版的 VARCHAR BINARY 的改良。
另外還讀到更便利的做法,不消逐一改字段屬性,而只需表格級其余collation為latin1_bin就好了。
測試:
alter table comment_content_1_01 CONVERT TO CHARACTER SET latin1 COLLATE latin1_bin
後,
再導出表構造
CREATE TABLE comment_content_1_01 (
content_id int(11) NOT NULL auto_increment,
thread varchar(50) collate latin1_bin default NULL,
uname varchar(100) collate latin1_bin default NULL,
nick varchar(100) collate latin1_bin default NULL,
uid int(11) unsigned default NULL,
content text collate latin1_bin,
post_time datetime default NULL,
post_ip int(10) unsigned default NULL,
`status` enum('unaudit','normal','deleted') collate latin1_bin NOT NULL default 'unaudit',
PRIMARY KEY (content_id)
) ENGINE=MyISAM DEFAULT CHARSET=latin1 COLLATE=latin1_bin;
即使本來沒定各字段的 collate,如今也全都是 collate latin1_bin 了。