最近碰到一個問題,要在一段HTML代碼的鏈接中加一個參數,比如其中由一個A標簽是這樣的:
1
<a href="http://www.example.com/aaa.php">鏈接文字</a>
我就要在 aaa.php 的後面加上一個參數使其變成 aaa.php?request=xxx ,但問題是不是所有的鏈接都是aaa.php這樣的形式,可能後面已經有了別的參數,比如 aaa.php?id=111 ,這樣加的時候就需要把鏈接變成 aaa.php?id=111&request=xxx 。
由於要處理的是一大塊HTML,所以首先想到的解決方案是正則替換,不過 preg_replace 不能做條件判斷,只能做一種替換,然後我就找到了 preg_replace_callback() 這個函數,大喜,以為找到了銀彈。這個東西的用法和 preg_replace() 函數幾乎一樣,不過它提供了一個 callback 函數,可以在替換的時候根據條件替換。在PHP手冊中提供了這麼一個例子:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
<?php // 此文本是用於 2002 年的, // 現在想使其能用於 2003 年 $text = "April fools day is 04/01/2002\n"; $text.= "Last christmas was 12/24/2001\n"; // 回調函數 function next_year($matches) { // 通常:$matches[0] 是完整的匹配項 // $matches[1] 是第一個括號中的子模式的匹配項 // 以此類推 return $matches[1].($matches[2]+1); } echo preg_replace_callback( "|(\d{2}/\d{2}/)(\d{4})|", "next_year", $text); // 結果為: // April fools day is 04/01/2003 // Last christmas was 12/24/2002 ?>
看了這個例子之後我以為只要把想要替換的內容替換掉就OK了,比如我只想更改捕獲的第二個匹配項,只需要把 $matches[2]中的內容改一下返回就行了。然後我就寫了下面的代碼測試:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
$content = '<a href="http://www.example.com/aaa.php">鏈接1</a><a href="http://www.example.com/aaa.php?id=111">鏈接2</a>'; $content = preg_replace_callback('/href=[\'|"](.*?)[\'|"]/', 'add_request', $content); // 下面是 add_request 函數定義 function add_source($matches) { if(strpos($matches[1], '?')) { return $matches[1].'&request=xxx'; } else { return $matches[1].'?request=xxx'; } }
不過實驗之後卻發現把代碼替換得亂七八糟,我找了半天都沒發現哪裡出錯了。後來仔細檢查了一下才恍然大悟,我被手冊上的例子誤導了!!其實這個函數會替換匹配的整個內容,即 /href=[\'|"](.*?)[\'|"]/ (包括 href),而不只是 (.*?) 所捕獲的東西。而手冊例子中的正則是這樣的:|(\d{2}/\d{2}/)(\d{4})| ,它的所有部分都是在()內的,所以替換成 $matches[1].($matches[2]+1) 自然不會有問題,但是它卻讓我誤以為這個函數會有針對性地替換 $matches[1] 和 $matches[2]中的內容,事實上它還是替換整個正則匹配的內容,即 $matches[0]中的內容,而加上的括號只是為了我們對字符串操作方便而已!了解這一點之後,修改了代碼:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
$content = '<a href="http://www.example.com/aaa.php">鏈接1</a><a href="http://www.example.com/aaa.php?id=111">鏈接2</a>'; $content = preg_replace_callback('/href=[\'|"](.*?)[\'|"]/', 'add_request', $content); // 下面是 add_request 函數定義 function add_source($matches) { if(strpos($matches[1], '?')) { return 'href="'.$matches[1].'&request=xxx"'; //注意,這裡和下面都加上了正則裡括號外的東西:href=" } else { return 'href="'.$matches[1].'?request=xxx"'; } }
改好之後,測試正常。
一點學習筆記,記錄在此。