在php5.4以前做json_encode的時候中文會被unicode編碼,中文都會被編碼,變成不可讀的,類似“\u***”的格式,還會在一定程度上增加傳輸的數據量。
例如:
復制代碼 代碼如下:
<?php
$str = '中文';
echo json_encode($str);
//"\u4e2d\u6587"
php5.4開始
echo json_encode($str, JSON_UNESCAPED_UNICODE);
//"中文"
php5.4讓json更懂中文!
5.4之前不進行unicode轉碼,有3種方法處理:
但其實前兩種方式是會導致問題,在一些特殊的情況下。如下例:
復制代碼 代碼如下:
function myjson($code) {
$code = json_encode(urlencodeAry($code));
return urldecode($code);
}
function urlencodeAry($data) {
if(is_array($data)) {
foreach($data as $key=>$val) {
$data[$key] = urlencodeAry($val);
}
return $data;
} else {
return urlencode($data);
}
}
$test = array (
0 => '"大連周水子機場"→人民路',
1 => '運營時間:5:10~21:00 票價:16元 發車間隔20分鐘一班,客滿隨時發車',
);
/*
通過常規則的json_encode|json_decode來編解碼
["\"\u5927\u8fde\u5468\u6c34\u5b50\u673a\u573a\"\u2192\u4eba\u6c11\u8def","\u8fd0\u8425\u65f6
\u95f4\uff1a5\uff1a10\uff5e21\uff1a00 \u7968\u4ef7\uff1a16\u5143 \u53d1\u8f66\u95f4\u969420
\u5206\u949f\u4e00\u73ed\uff0c\u5ba2\u6ee1\u968f\u65f6\u53d1\u8f66"]
array (
0 => '"大連周水子機場"→人民路',
1 => '運營時間:5:10~21:00 票價:16元 發車間隔20分鐘一班,客滿隨時發車',
)
*/
$test1 = json_encode($test);
$test2 = json_decode($test1, TRUE);
echo $test1;
echo PHP_EOL;
var_export($test2);
echo PHP_EOL;
/*
通過myjson|json_decode來編解碼,但是會出報錯json_last_error返回(JSON_ERROR_SYNTAX === 4),
因為""大連周水子機場"→人民路"
[""大連周水子機場"→人民路","運營時間:5:10~21:00 票價:16元 發車間隔20分鐘一班,客滿隨時發車"]
NULL
*/
$test1_1 = myjson($test);
$test2_1 = json_decode($test1_1, TRUE);
echo $test1_1;
echo PHP_EOL;
var_export($test2_1);
echo PHP_EOL;
/*
通過json_enco+pack|json_decode來編解碼,保證不會對中文編碼,但是會缺少運營時間數據和票價
["\"大連周水子機場\"→人民路","運營時間::~: 票價:元 發車間隔分鐘一班,客滿隨時發車"]
array (
0 => '"大連周水子機場"→人民路',
1 => '運營時間::~: 票價:元 發車間隔分鐘一班,客滿隨時發車',
)
*/
function replaceUni($str) {
return preg_replace("#\\\u([0-9a-f]+)#ie", "iconv('UCS-2', 'UTF-8', pack('H4', '\\1'))", $str);
}
$test1_2 = replaceUni(json_encode($test));
$test2_2 = json_decode($test1_2, TRUE);
echo $test1_2;
echo PHP_EOL;
var_export($test2_2);
echo PHP_EOL;
最後總結一句,推薦升級到PHP5.4,讓PHP更懂中文!