大家都知道,json_encode通常會把json中的漢字轉義成unicode,但是這並不一定是我們想要的。有時候,我們需要獲得漢字形式的json字符串,比如需要獲得gbk編碼的json字符串(只要把漢字形式的字符串轉碼就可以得到了)。有什麼好辦法麼?
php官方聽到了這個需求,並提供了一種可靠的解決方案:JSON_UNESCAPED_UNICODE。這個參數可以保證json_encode不再將漢字轉為unicode。
似乎這樣就解決了?當我們高高興興的用這個參數的時候,發現並沒有什麼卵用。仔細一看,這個參數只有5.4之後的php支持。那更早期的php怎麼辦呢?
社區提供了一種方案:
function my_json_encode($arr){ //convmap since x char codes so it takes all multibyte codes (above ASCII ). So such characters are being "hidden" from normal json_encoding array_walk_recursive($arr, function (&$item, $key) { if (is_string($item)) $item = mb_encode_numericentity($item, array (x, xffff, , xffff), 'UTF-'); }); return mb_decode_numericentity(json_encode($arr), array (x, xffff, , xffff), 'UTF-'); }
不過這種方法只有5.3才支持,因為5.2並不支持匿名函數。至於解決辦法?把匿名函數定義一下即可。
ps:解決json_encode中文UNICODE轉碼問題
用PHP的json_encode來處理中文的時候, 中文都會被編碼, 變成不可讀的, 類似”\u***”的格式,如果想漢字不進行轉碼,這裡提供三種方法
1.升級PHP,在PHP5.4, 這個問題終於得以解決, Json新增了一個選項: JSON_UNESCAPED_UNICODE, 故名思議, 就是說, Json不要編碼Unicode.
<?php echo json_encode("中文", JSON_UNESCAPED_UNICODE); //"中文"
2.把漢字先urlencode然後再使用json_encode,json_encode之後再次使用urldecode來解碼,這樣編碼出來的json數組中的漢字就不會出現unicode編碼了。
$array = array( 'test'=>urlencode("我是測試") ); $array = json_encode($array); echo urldecode($array); //{"test":"我是測試"}
3.對unicode碼再進行解碼,解碼函數如下:
function decodeUnicode($str) { return preg_replace_callback('/\\\\u([0-9a-f]{4})/i', create_function( '$matches', 'return mb_convert_encoding(pack("H*", $matches[1]), "UTF-8", "UCS-2BE");' ), $str); }