其原理就是把中文字符轉換為十六進制並按某種規則進行字符串組合,實現字符的編碼與解編碼,保證URL數據傳遞過程中字符的完整性和兼容性,主要討論中文字符的編碼情況。
一,FireFox浏覽器編碼中文字符 在Firefox浏覽器下如果輸入中文字符,將會自動實現URL編碼,如下
按下Enter鍵前
按下Enter鍵後
二,urlencode()函數原理
urlencode()函數用於編碼URL字符串,這裡主要討論中文字符的編碼情況,
實例如下
復制代碼 代碼如下:
echo urlencode('不要迷戀哥');//輸出:%B2%BB%D2%AA%C3%D4%C1%B5%B8%E7
urlencode()函數原理就是首先把中文字符轉換為十六進制,然後在每個字符前面加一個標識符%,了解了這個原理,可以實現自定義的URL編碼函數,代碼如下
復制代碼 代碼如下:
$string = "不要迷戀哥";
$length = strlen($string);
echo $string;
$result = array();
//十進制
for($i=0;$i<$length;$i++){
if(ord($string[$i])>127){
$result[] = ord($string[$i]).' '.ord($string[++$i]);
}
}
var_dump($result);
//十六進制
$strings = array();
foreach($result as $v){
$dec = explode(" ",$v);
$strings[] = "%".dechex($dec[0])." "."%".dechex($dec[1]);
}
var_dump($strings);
上面代碼在[PHP實現中文字符進制轉換原理分析]一文中中文字符轉十六進制原理分析部分有詳細討論,通過獲取漢字的各個字符再轉換為十六進制,同時在每個字符前面加上一個特殊的標識符%,就實現了urlencode()函數的功能,輸出結果如下
然後對輸出的結果與直接使用urlencode()編碼的字符進行比較,如上:%B2%BB%D2%AA%C3%D4%C1%B5%B8%E7
通過上面實例可知,使用urlencode()函數編碼中文字符實質上就是把字符轉換為十六進制再在第個字符左邊加上一個特殊的標識符%
三,urldecode()函數原理 使用urldecode()函數解碼已編碼的 URL 字符串,實例如下
echo urldecode('%B2%BB%D2%AA%C3%D4%C1%B5%B8%E7');//輸出:不要迷戀哥
urldecode()函數與urlencode()函數原理相反,用於解碼已編碼的 URL 字符串,其原理就是把十六進制字符串轉換為中文字符,結合上面實例,同樣可實現自定義函數解碼字符串
復制代碼 代碼如下:
$string = '%B2%BB%D2%AA%C3%D4%C1%B5%B8%E7';
$length = strlen($string);
$hexs = array();
for($i=0;$i<$length;$i++){
if($string[$i] == '%'){
$hexs[] = $string[++$i].$string[++$i];
}
}
$num = count($hexs);
for($i=0;$i<$num;$i++){
echo chr(hexdec($hexs[$i])).chr(hexdec($hexs[++$i]));
}
上面實例代碼首先按字符串的規則取出各個字符的十六進制,然後使用hexdec()函數把十六進制轉換為十進制,然後再使用chr()函數把十進制轉換為字符,實現十六進制轉換為字符。輸出結果如下
四,urldecode()與urlencode()函數說明urlencode(PHP 3, PHP 4, PHP 5)
urlencode -- 編碼 URL 字符串
說明
string urlencode ( string str )
返回字符串,此字符串中除了 -_. 之外的所有非字母數字字符都將被替換成百分號(%)後跟兩位十六進制數,空格則編碼為加號(+)。此編碼與 WWW 表單 POST 數據的編碼方式是一樣的,同時與 application/x-www-form-urlencoded 的媒體類型編碼方式一樣。由於歷史原因,此編碼在將空格編碼為加號(+)方面與 RFC1738 編碼(參見 rawurlencode())不同。此函數便於將字符串編碼並將其用於 URL 的請求部分,同時它還便於將變量傳遞給下一頁
urldecode(PHP 3, PHP 4, PHP 5)
urldecode -- 解碼已編碼的 URL 字符串
說明
string urldecode ( string str )
解碼給出的已編碼字符串中的任何 %##。返回解碼後的字符串。
五,參考資源urlencode()說明
urldecode()說明