codeIgniter默認的配置下是不允許URL中包含非ASCII字符的,如果URL中含非ASCII字符,那麼CI會毫不客氣的拋出錯誤。本文章向碼農介紹CodeIgniter 如何解決URL含有中文字符串。
你 可能會說,那我把這個URL使用函數urlencode一下呢?不行。因為Web Server會在接收到一個被urlencode的URL後自動將其decode,然後在PHP裡得到的這些字符串轉換成他原來所代表的含義,並使用 Web Server自己的URL編碼字符集(IIS6 中文版是GBK,Apache 2.2是UTF-8)傳送給應用程序,這就使得CI得到的URL已經是一個解碼過的,無論你有沒有對URL進行urlencode,浏覽器在發出請求時會 自動檢測,若沒有,則會自動進行編碼。所以,手動的進行urlencode並不能解決問題。那麼我們應該怎麼做來解決這個問題呢?
對於CI這種框架,用到現在,我的觀點是盡量不要去修改它,而是去擴展他,CI提供了很好的擴展機制,我們只需要在application/core/下(2.0版本以前的為application/libraries/)增加一個文件MY_URI.php,其內容為:
<?php if ( ! defined('BASEPATH')) exit('No direct script access allowed'); class MY_URI extends CI_URI { /** * 自定義的url過濾函數 * * @access private * @param string * @return string */ function _filter_uri($str) { if ($str != '' AND $this->config->item('permitted_uri_chars') != '') { $str = urlencode($str); if ( ! preg_match("|^[".preg_quote($this->config->item('permitted_uri_chars'))."]+$|i", $str)) { exit('The URI you submitted has disallowed characters.'); } $str = urldecode($str); } return $str; } }
我覆蓋了原來CI_URI中的_filter_uri方法,這樣就可以使得中文的URL通過檢測。但是,如果URL裡有空格, 也不行了,怎麼辦呢?原來,urlencode會將空格轉換成+,而CI的默認配置中是不允許+出現在URL裡的,OK,把
$config ['permitted_uri_chars'] = 'a-z 0-9~%.:_\-';
改成
$config['permitted_uri_chars'] = 'a-z 0-9~%.:_\+\-';
就可以了。
或者
第一步把config.php 中的
$config['permitted_uri_chars'] = 'a-z 0-9~%.:_\-';
替換成
$config['permitted_uri_chars'] ='a-z 0-9~%.:_-u4e00-u9fa5';
面所有的操作我們都做完了,但是接下來你可能又遇到了新的問題,那就是url中得到的中文信息是亂碼,不知道在你的服務器上會不會遇到該問題,但是我遇到了(IIS)。但是在本地是正常的,本地用的是apache。
好,我在程序中,把$_SERVER['REQUEST_URI']打印出來,發現它就是亂碼的,苦思冥想,這是怎麼回事?這就說明在我得到uri中的參數之前,就已經被編碼了,好,我們使用iconv解碼:
iconv("gb2312","UTF-8",$uri);
現在打印出來看看,好了,原來的中文參數打印出來了,是正確的。
這個問題解決了,但是還是有一個疑問,url為什麼是gb2312編碼的呢,如果在我的程序中使用(我采用的是utf-8編碼),還需要轉換為utf-8編碼,是不是和web服務器是有關系的呢,希望大家能夠幫忙解答。
原文地址:http://www.manongjc.com/article/808.html
codeIgniter相關閱讀: