mysql5.1中utf8編碼下一個漢字占用一個char的疑惑
最近發現Oracle和MySQL的字段長度的計算不一樣(都是UTF8編碼),比如:
在Oracle下定義:name varchar2(10) ,name字段能存放:10個字符或3個漢字
在MySQL下定義:name varchar(10),name字段能存放:10個字符或10個漢字
從上面可以得知:在oracle下,1個漢字=3個字節
為什麼在 MySQL 下,1個漢字=1個字節 呢??
經查,說:MySQL5 以後 varchar 的單位是字符了,而 oracle 的varchar2 是字節
編碼不一樣一個漢字占用的字節也不一樣:
UTF-8 下 1漢字=3字節
GDK下 1漢字=2字節
mysql varchar(50),不管中文還是英文都是存50個的。
MySQL5的文檔,其中對varchar字段類型這樣描述:varchar(m) 變長字符串。M 表示最大列長度。M的范圍是0到65,535。(VARCHAR的最大實際長度由最長的行的大小和使用的字符集確定,最大有效長度是65,532字節)。
為何會這般變換?真是感覺MySQL的手冊做的太不友好了,因為你要仔細的繼續往下讀才會發現這段描述:MySQL 5.1遵從標准SQL規范,並且不刪除VARCHAR值的尾部空格。VARCHAR保存時用一個字節或兩個字節長的前綴+數據。如果VARCHAR列聲明的長度大於255,長度前綴是兩個字節。
好了,貌似懂了一點。但具體他說的長度大於255時使用2個字節長度前綴,小學減法題:65535 - 2 = 65533啊。不知道這些大牛如何計算的,暫且保留疑問吧?
注:我測試了一下使用UTF8編碼,varchar的最大長度為21854字節。
在mysql 5.0.45版本,數據庫編碼utf8下進行測試:varchar最長定義為21785。也就是說不論字母、數字、漢字,只能放21785個。
推想:varchar字節最大65535,utf8編碼一個字符3個字節65535/3=21785。但是用length函數取值的時候發現,一個漢字占3個字節,一個字母等字符占用一個字節。這個對於char(10)來說,是不是實際長度是不定的呢?