在 PHP 裡面替換字符串有很多種方法,str_replace 是再常見不過了,復雜一點的也可能會用到 preg_replace 方法。
這兩個方法(str_replace 和 preg_replace)除了正則外,在循環替換的問題上也有一個惡心的差異。先看看各自的語法說明:
str_replace
mixed str_replace ( mixed $search , mixed $replace , mixed $subject [, int &$count ] )
preg_replace
mixed preg_replace ( mixed $pattern , mixed $replacement , mixed $subject [, int $limit = -1 [, int &$count ]] )
很明顯在可選的參數列表中,preg_replace 多了個 limit 項,這個 limit 項控制了字符串替換操作的次數。
那麼問題來了,現在需要實現如下一個需求,將下列代碼中的兩個 {module} 分別替換成不同的字符串:
<div class="layout grid-m0s5">
<div class="col-main">
<div class="main-wrap J_Region">{module}</div>
</div>
<div class="col-sub J_Region">{module}</div>
</div>
如果用 str_replace 方法,一次替換操作無法實現只替換一個 {module} 字符串。
如果用 preg_replace 方法,發現這個會造成個要命的 bug,比如下面這段代碼:
<?php
$replace = '$12.34';
$subject = 'Pay {replace} for it.';
echo preg_replace('/\{replace\}/', $replace, $subject);
?>
輸出的結果是:
Pay .34 for it.
而不是期望的:
Pay $12.34 for it.
究其原因,是因為 preg_replace 的第二參數存在後向引用的問題:
replacement中可以包含後向引用\\n 或(php 4.0.4以上可用)$n,語法上首選後者。 每個 這樣的引用將被匹配到的第n個捕獲子組捕獲到的文本替換。 n 可以是0-99,\\0和$0代表完整的模式匹配文本。 捕獲子組的序號計數方式為:代表捕獲子組的左括號從左到右, 從1開始數。如果要在replacement 中使用反斜線,必須使用4個(“\\\\”,譯注:因為這首先是php的字符串,經過轉義後,是兩個,再經過 正則表達式引擎後才被認為是一個原文反斜線)。
要避免這個問題,有兩個解決方案:
第一種,$ 符號使用實體字符($),避免造成和 PHP 語言的沖突。
第二種,使用 strpos 結合 substr_replace 的方法。例如:
$start = strpos($str, '{module}');
$str = substr_replace($str, 'http://www.mangguo.org', $start, sizeof('{module}'));
參考資料:
[1] http://php.net/manual/zh/function.str-replace.php
[2] http://php.net/manual/zh/function.preg-replace.php