程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 數據庫知識 >> MYSQL數據庫 >> MySQL綜合教程 >> mysql之字符集與校對集

mysql之字符集與校對集

編輯:MySQL綜合教程

mysql之字符集與校對集


一、字符集

1.mysql的字符集設置非常靈活

可以設置服務器默認字符集;

數據庫默認字符集;

表默認字符集;

列字符集;

如果某一級別沒有指定字符集,則繼承上一級。

查看所有字符集語句:show character set;

2.以表聲明為utf-8為例,最終存儲在表中的數據為utf-8

\

①我們要告訴服務器,我給你發送的數據是什麼編碼?character_set_client

②告訴字符集轉換器,轉換成什麼編碼?character_set_connection

③查詢的結果用什麼編碼?character_set_results

如果以上三者都為字符集N,可簡寫為set names N;

3.什麼情況下會出現亂碼呢?

我們首先創建一個測試表指定表的字符集為utf8

create table temp(

name varchar(10)

) charset utf8;

然後執行這三條命令:

set character_set_client=gbk;

set character_set_connection=gbk;

set_character_set_results=gbk; 這三句可以簡寫為set names gbk;

最後往表裡插入一條數據:

insert into temp values('中國');

select * from temp;這時候顯示的結果是正常的。

當我們再執行這句命令時:set character_results=utf8;

出現亂碼了,如圖:

\

由此可得出當返回的結果result的字符集與客戶端的字符集不符的時候會出現亂碼。

還有一種情況也會出現亂碼:client聲明與事實不符時,你客戶端明明是utf8,你卻非要叫我轉成gbk的,如下圖:

\

可能還有很多種情況,這裡沒有一一列舉。

4.什麼情況下會造成數據的丟失呢?

執行這三條語句:

set character_set_client=gbk;

set character_set_connection=latin1;

set character_set_results=gbk;

再往表裡插入一條數據:insert into temp values('美國');

最後查詢的時候結果如下圖:

 

\

數據丟失了。

由此可得出當connection和服務器的字符集比client小時,會造成數據的丟失,可能用語不是很准確,但是能理解即可以了。個人理解,就跟java裡面不同數據類型相互轉換時一樣,比如把double類型強制轉換成int類型,就會造成精度的丟失一樣。

。。。。。。 

   

二、校對集

什麼是校對集?

校對集:指字符集的排序規則。

查看所有校對集語句:show collation;

一種字符集可以有一個或多個排序規則。

以utf8為例,默認是使用utf8_general_ci校對集,也可以按二進制來排,utf8_bin

怎樣聲明校對集?

create table tableName

(

  ...

)charset utf8 collate utf8_general_ci;

注意:聲明的校對集必須是字符集合法的校對集。比如你字符集是utf8,你不能聲明gbk的校對集。

 

三、校對規則的“可壓縮性”

在絕大多數查詢中,mysql使用哪種校對規則進行比較是很顯然的。例如,在下列情況中,校對規則明顯的是“列x的列校對規則”:


  select x from T orderbyx; select x from T wherex = x; select distinct x fromT;

但是,當涉及多個操作數時,可能不明確。例如:


  select x from T wherex ='Y';

這個查詢應該使用列x的校對規則,還是字符串文字'Y'的校對規則?

標准化SQL使用“可壓縮性”規則解決這種問題。基本上,這個意思是:既然x和'Y'都有 校對規 則,哪個校對規則優先?這可能比較難解決,但是以下規則適合大多數情況:

一個外在的COLLATE子句可壓縮性是0(根本不能壓縮。)使用不同校對規則的兩個字符串連接的可壓縮性是1。列校對規則的可壓縮性是2。“系統常數”(如USER()或VERSION()函數返回的字符串)可壓縮性是3。文字規則的可壓縮性是4。NULL或從NULL派生的表達式的可壓縮性是 5。

上述可壓縮性值是mysql當前所用的。

這樣上述規則可以模糊解決:

使用最低的可壓縮性值的校對規則。如果兩側有相同的可壓縮性,那麼如果校對規則不同則發生錯誤。

使用COERCIBILITY()函數確定一個字符串表達式的可壓縮性:


  mysql> SELECTCOERCIBILITY('A'COLLATE latin1_swedish_ci); -> 0 mysql> SELECTCOERCIBILITY(VERSION()); -> 3 mysql> SELECTCOERCIBILITY('A'); -> 4

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved