以下所描述無理論依據,純屬經驗談。
MySQL使用4.1以上版本,管他是什麼字符集,一律使用默認。不用去設置MySQL。
然後舉個使用GB2312和UTF-8的例子。
好,你只要保證你的寫著INSERT SQL語句的PHP文件編碼為GB2312,恭喜你,你使用寫著SELECT SQL語句的GB2312編碼的PHP文件讀取出來的數據也是GB2312的。
同理,只要你插入數據庫的PHP文件是UTF-8編碼,那麼你錄入的就是UTF-8的,讀取出來同樣使用編碼為UTF-8的讀取。
如果我錄入為GB2312,顯示要使用UTF-8怎麼辦?
如果你的所有PHP文件為UTF-8編碼,那麼你在INSERT的時候,就必須使用iconv進行編碼轉換,將str轉為GB2312入庫,讀取也一樣,使用iconv轉為UTF-8顯示。
你的前端頁面使用什麼編碼,那麼你那些字符串已經被該種編碼編過了,所以,盡管入庫,他的機器碼肯定就是那樣的,不管存放在哪裡,不管MySQL指定為何種編碼,他在錄入數據的時候,並不會對你的數據進行轉換。只要保證你的前端錄入使用UTF-8,那麼你讀取的也是UTF-8。
為什麼使用PHPMYADMIN導入總是有問題呢?
我沒有研究過PHPMYADMIN的工作原理,但是他的PHP文件都是UTF-8編碼的,也就是這樣導入數據都是UTF-8的,你采用GB2312的PHP文件來讀取,當然一堆亂。
解決辦法我猜有三種:
讀取的時候,使用SET NAME將其編碼轉換,不知道可行不,
讀取後使用iconv將其轉為GB2312,
不用PHPMYADMIN導入,自己寫個GB2312的PHP腳本導入即可。
總之一句話,你錄入的時候采用什麼編碼,那麼你讀取的時候他就是什麼編碼。你想把這種編碼顯示成另外一種編碼,那麼你需 要使用iconv或者mbstring將其進行編碼轉換。
以上僅為個人實際經驗,沒時間研究理論。歡迎大家探討或者有錯誤請指正。