深刻懂得mysql SET NAMES和mysql(i)_set_charset的差別。本站提示廣大學習愛好者:(深刻懂得mysql SET NAMES和mysql(i)_set_charset的差別)文章只能為提供參考,不一定能成為您想要的結果。以下是深刻懂得mysql SET NAMES和mysql(i)_set_charset的差別正文
說到, 盡可能應用mysqli_set_charset(mysqli:set_charset)而不是”SET NAMES”, 固然, 這個內容在PHP手冊中也有敘及, 然則卻沒有說明為何.
比來有好幾個同伙問我這個成績, 究竟為何?
問的人多了, 我也就認為可以寫篇blog, 專門引見下這部門的內容了.
起首, 許多人都不曉得”SET NAMES”究竟是做了甚麼,
我之前的文章深刻MySQL字符集設置中, 已經引見過character_set_client/character_set_connection/character_set_results這三個MySQL的”情況變量”, 這裡再簡略引見下,
這三個變量, 分離告知MySQL辦事器, 客戶真個編碼集, 在傳輸給MySQL辦事器的時刻的編碼集, 和希冀MySQL前往的成果的編碼集.
好比, 經由過程應用”SET NAMES utf8″, 就告知辦事器, 我用的是utf-8編碼, 我願望你也給我前往utf-8編碼的查詢成果.
普通情形下, 應用”SET NAMES”就足夠了, 也是可以包管准確的. 那末為何手冊又要說推舉應用mysqli_set_charset(PHP>=5.0.5)呢?
起首, 我們看看mysqli_set_charset究竟做了甚麼(留意星號正文處, mysql_set_charset相似):
//php-5.2.11-SRC/ext/mysqli/mysqli_nonapi.c line 342
PHP_FUNCTION(mysqli_set_charset)
{
MY_MYSQL *mysql;
zval *mysql_link;
char *cs_name = NULL;
unsigned int len;
if (zend_parse_method_parameters(ZEND_NUM_ARGS() TSRMLS_CC, getThis()
, "Os", &mysql_link, mysqli_link_class_entry, &cs_name, &len) == FAILURE) {
return;
}
MYSQLI_FETCH_RESOURCE(mysql, MY_MYSQL*, &mysql_link, "mysqli_link"
, MYSQLI_STATUS_VALID);
if (mysql_set_character_set(mysql->mysql, cs_name)) {
//** 挪用libmysql的對應函數
RETURN_FALSE;
}
RETURN_TRUE;
}
那mysql_set_character_set又做了甚麼呢?
//mysql-5.1.30-SRC/libmysql/client.c, line 3166:
int STDCALL mysql_set_character_set(MYSQL *mysql, const char *cs_name)
{
struct charset_info_st *cs;
const char *save_csdir= charsets_dir;
if (mysql->options.charset_dir)
charsets_dir= mysql->options.charset_dir;
if (strlen(cs_name) < MY_CS_NAME_SIZE &&
(cs= get_charset_by_csname(cs_name, MY_CS_PRIMARY, MYF(0))))
{
char buff[MY_CS_NAME_SIZE + 10];
charsets_dir= save_csdir;
/* Skip execution of "SET NAMES" for pre-4.1 servers */
if (mysql_get_server_version(mysql) < 40100)
return 0;
sprintf(buff, "SET NAMES %s", cs_name);
if (!mysql_real_query(mysql, buff, strlen(buff)))
{
mysql->charset= cs;
}
}
//以下省略
我們可以看到, mysqli_set_charset除做了”SET NAMES”之外, 還多做了一步:
sprintf(buff, "SET NAMES %s", cs_name);
if (!mysql_real_query(mysql, buff, strlen(buff)))
{
mysql->charset= cs;
}
而關於mysql這個焦點構造的成員charset又有甚麼感化呢?
這就要說說mysql_real_escape_string()了, 這個函數和mysql_escape_string的差別就是, 它會斟酌”以後”字符集. 那末這個以後字符集從哪裡來呢?
對了, 你猜的沒錯, 就是mysql->charset.
mysql_real_string在斷定寬字符集的字符的時刻, 就依據這個成員變量來分離采取分歧的戰略, 好比假如是utf-8, 那末就會采取libmysql/ctype-utf8.c.
看個實例, 默許mysql銜接字符集是latin-1, (經典的5c成績):
<?php
$db = mysql_connect('localhost:3737', 'root' ,'123456');
mysql_select_db("test");
$a = "\x91\x5c";//"慭"的gbk編碼, 低字節為5c, 也就是ascii中的"\"
var_dump(addslashes($a));
var_dump(mysql_real_escape_string($a, $db));
mysql_query("set names gbk");
var_dump(mysql_real_escape_string($a, $db));
mysql_set_charset("gbk");
var_dump(mysql_real_escape_string($a, $db));
?>
由於, “慭”的gbk編碼低字節為5c, 也就是ascii中的”\”, 而由於除mysql(i)_set_charset影響mysql->charset之外, 其他時辰mysql->charset都為默許值, 所以, 成果就是:
$ php -f 5c.php
string(3) "慭\"
string(3) "慭\"
string(3) "慭\"
string(2) "慭"
年夜家如今很清晰了吧?