程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> 關於PHP編程 >> PHP 正則表達式常用函數,php正則表達式函數

PHP 正則表達式常用函數,php正則表達式函數

編輯:關於PHP編程

PHP 正則表達式常用函數,php正則表達式函數


1.preg_match()

函數原型:int preg_match (string $pattern, string $content [, array $matches])
preg_match ()函數在$content字符串中搜索與$pattern給出的正則表達式相匹配的內容。如果提供了$matches,則將匹配結果放入其 中。$matches[0]將包含與整個模式匹配的文本,$matches[1]將包含第一個捕獲的與括號中的模式單元所匹配的內容,以此類推。該函數只 作一次匹配,最終返回0或1的匹配結果數。代碼6.1給出preg_match()函數的一段代碼示例。
代碼6.1 日期時間的匹配
代碼如下:

<?php 
//需要匹配的字符串。date函數返回當前時間 
$content = "Current date and time is ".date("Y-m-d h:i a").", we are learning PHP together."; 
//使用通常的方法匹配時間 
if (preg_match ("//d{4}-/d{2}-/d{2} /d{2}:/d{2} [ap]m/", $content, $m)) 
{ 
echo "匹配的時間是:" .$m[0]. "/n"; 
} 
//由於時間的模式明顯,也可以簡單的匹配 
if (preg_match ("/([/d-]{10}) ([/d:]{5} [ap]m)/", $content, $m)) 
{ 
echo "當前日期是:" .$m[1]. "/n"; 
echo "當前時間是:" .$m[2]. "/n"; 
} 
?>

這是一個簡單動態文本串匹配實例。假設當前系統時間是“2006年8月17日13點25分”,將輸出如下的內容。
匹配的時間是:2006-08-17 01:25 pm
當前日期是:2006-08-17
當前時間是:01:25 pm

2.ereg()和eregi()

ereg()是POSIX擴展庫中正則表達式的匹配函數。eregi()是ereg()函數的忽略大小寫的版 本。二者與preg_match的功能類似,但函數返回的是一個布爾值,表明匹配成功與否。需要說明的是,POSIX擴展庫函數的第一個參數接受的是正則 表達式字符串,即不需要使用分界符。例如,代碼6.2是一個關於文件名安全檢驗的方法。
代碼6.2 文件名的安全檢驗
代碼如下:

<?php 
$username = $_SERVER['REMOTE_USER']; 
$filename = $_GET['file']; 
//對文件名進行過濾,以保證系統安全 
if (!ereg('^[^./][^/]*$', $userfile)) 
{ 
die('這不是一個非法的文件名!'); 
} 
//對用戶名進行過濾 
if (!ereg('^[^./][^/]*$', $username)) 
{ 
die('這不是一個無效的用戶名'); 
} 
//通過安全過濾,拼合文件路徑 
$thefile = "/home/$username/$filename"; 
?>

通常情況下,使用與Perl兼容的正則表達式匹配函數perg_match(),將比使用ereg()或eregi()的速度更快。如果只是查找一個字符串中是否包含某個子字符串,建議使用strstr()或strpos()函數。

正則表達式的替換

1.ereg_replace()和eregi_replace()

函數原型:string ereg_replace (string $pattern, string $replacement, string $string)
string eregi_replace (string $pattern, string $replacement, string $string)
ereg_replace()在$string中搜索模式字符串$pattern,並將所匹配結果替換 為$replacement。當$pattern中包含模式單元(或子模式)時,$replacement中形如“/1”或“$1”的位置將依次被這些子 模式所匹配的內容替換。而“/0”或“$0”是指整個的匹配字符串的內容。需要注意的是,在雙引號中反斜線作為轉義符使用,所以必須使用“//0”,“ //1”的形式。
eregi_replace()和ereg_replace()的功能一致,只是前者忽略大小寫。代碼6.6是本函數的應用實例,這段代碼演示了如何對程序源代碼做簡單的清理工作。
代碼6.6 源代碼的清理
代碼如下:

<?php 
$lines = file('source.php'); //將文件讀入數組中 
for($i=0; $i<count($lines); $i++) 
{ 
//將行末以“//”或“#”開頭的注釋去掉 
$lines[$i] = eregi_replace("(////|#).*$", "", $lines[$i]); 
//將行末的空白消除 
$lines[$i] = eregi_replace("[ /n/r/t/v/f]*$", "/r/n", $lines[$i]); 
} 
//整理後輸出到頁面 
echo htmlspecialchars(join("",$lines)); 
?>

2.preg_replace()

函數原型:mixed preg_replace (mixed $pattern, mixed $replacement, mixed $subject [, int $limit])
preg_replace較ereg_replace的功能更加強大。其前三個參數均可以使用數組;第四個參數$limit可以設置替換的次數,默認為全部替換。代碼6.7是一個數組替換的應用實例。
代碼6.7 數組替換
代碼如下:

<?php 
//字符串 
$string = "Name: {Name}<br>/nEmail: {Email}<br>/nAddress: {Address}<br>/n"; 
//模式 
$patterns =array( 
"/{Address}/", 
"/{Name}/", 
"/{Email}/" 
); 
//替換字串 
$replacements = array ( 
"No.5, Wilson St., New York, U.S.A", 
"Thomas Ching", 
"[email protected]", 
); 
//輸出模式替換結果 
print preg_replace($patterns, $replacements, $string); 
?>

輸出結果如下。

Name: Thomas Ching", 
Email: [email protected] 
Address: No.5, Wilson St., New York, U.S.A 

在preg_replace的正則表達式中可以使用模式修正符“e”。其作用是將匹配結果用作表達式,並且可以進行重新運算。例如:
代碼如下:

<?php 
$html_body = “<HTML><Body><H1>TEST</H1>My Picture<Img src=”my.gif”></Body></HTML>”; 
//輸出結果中HTML標簽將全部為小寫字母 
echo preg_replace ( 
"/(<//?)(/w+)([^>]*>)/e", 
"'//1'.strtolower('//2').'//3'", //此處的模式變量//2將被strtolower轉換為小寫字符 
$html_body); 
?>

提示
preg_replace函數使用了Perl兼容正則表達式語法,通常是比ereg_replace更快的替代方案。如果僅對字符串做簡單的替換,可以使用str_replace函數。


怎運用PHP函數preg_match_all測試正則表達式效果

  PHP函數preg_match_all代碼實例:php自學網2< /div< div id="biuuu_3"php自學網3< /div';  PHP函數preg_match_all實例要求:分別將每一個DIV元素的ID和內容取出,如biuuu,biuuu_2,biuuu_3,php自學網,php自學網2和php自學網3(一些常用的抓站方法就是這樣匹配的)  分析:字符串是一個簡單的HTML元素,每一個DIV元素對應該一個ID和內容,並且是獨立的,首先考慮如何取出一個DIV內的ID值和內容, 如:php自學網,然後匹配其它類似的元素。一個DIV中需要取出兩個值,也就是兩個匹配的表達式,第一個表達式用於匹配ID值(biuuu),第二個表 達式用於匹配ID的內容(php自學網),正則表達式常用的表達式使用小括號,那麼前面的元素將會變成如下形式:  < div id="(biuuu)"(php自學網)< /div < div id="(表達式1)"(表達式2)< /div  表達式1:[a-zA-Z0-9_]+ (表示匹配大小寫字母,數字和下劃線)  表達式2:[^<]+ (表示不匹配<和字符)  這樣,PHP函數preg_match_all需要匹配的子表達式就實現了,但是還要需要匹配一個的表達式,方法如下:  表達式:/ '"(表達式1)"'(表達式2)/  注意其中的雙引號"和/需要使用轉義字符轉義,然後把前面兩個表達式放進去,如下:  '"([a-z0-9_]+)"'/< div id="([a-z0-9_]+)"([^<]+)< /div/  這樣就實現一個匹配每一個DIV元素ID值和內容的正則表達式,然後使用preg_match_all函數測試如下:  $html = '< div id="biuuu"php自學網< /div< div id="biuuu_2"php自學網2< /div< div id="biuuu_3"php自學網3< /div'; preg_match_all('/< divsiddivsid="([a-z0-9_]+)"([^<]+)< /div/',$html,$result); var_dump($result);  PHP函數preg_match_all示例結果:  array(3) { [0]= array(3) { [0]= string(30) "php自學網" [1]= string(33) "php自學網2" [2]= string(33) "php自學網3" } [1]= array(3) { [0]= string(5) "biuuu" [1]= string(7) "biuuu_2" [2]= string(7) "biuuu_3&......余下全文>>
 

怎運用PHP函數preg_match_all測試正則表達式效果

今天我們就為大家介紹PHP函數preg_match_all在正則表達式測試中的運用 。 PHP函數preg_match_all代碼實例:$html = < div id="biuuu">php自學網< /div>php自學網2< /div>< div id="biuuu_3">php自學網3< /div>; PHP動態網站開發的技巧分享PHP打印函數的種類總結PHP中$_SERVER的詳細資料整理PHP函數stristr()的具體使用方式介紹PHP代碼性能優化的技巧講解 PHP函數preg_match_all實例要求:分別將每一個DIV元素的ID和內容取出,如biuuu,biuuu_2,biuuu_3,php自學網,php自學網2和php自學網3(一些常用的抓站方法就是這樣匹配的)分析:字符串是一個簡單的HTML元素,每一個DIV元素對應該一個ID和內容,並且是獨立的,首先考慮如何取出一個DIV內的ID值和內容, 如:php自學網,然後匹配其它類似的元素 。一個DIV中需要取出兩個值,也就是兩個匹配的表達式,第一個表達式用於匹配ID值(biuuu),第二個表 達式用於匹配ID的內容(php自學網),正則表達式常用的表達式使用小括號,那麼前面的元素將會變成如下形式:< div id="(biuuu)">(php自學網)< /div> < div id="(表達式1)">(表達式2)< /div> 好,使用如上小括號把需要匹配的區域進行了劃分,接下來就是如何匹配各個表達式內的內容,我們猜想一個ID可能是字母,數字或下劃線,那這就變得簡單了,使用中括號就可以實現,如下: 表達式1:[a-zA-Z0-9_]+ (表示匹配大小寫字母,數字和下劃線) 那如何匹配表達式2,因為ID的內容可以是任意的字符,但是要注意,不能匹配<或>字符,因為如果匹配這兩個字符將會把後面使用的DIV都匹配出來,因此需要排除這兩個字符開始的元素,也就是不匹配以<或>字符,如下: 表達式2:[^<>]+ (表示不匹配<和>字符) 這樣,PHP函數preg_match_all需要匹配的子表達式就實現了,但是還要需要匹配一個的表達式,方法如下: 表達式:/ "(表達式1)">(表達式2)/ 注意其中的雙引號"和/需要使用轉義字符轉義,然後把前面兩個表達式放進去,如下:"([a-z0-9_]+)">/< div id="([a-z0-9_]+)">([^<>]+)< /div>/ 這樣就實現一個匹配每一個DIV元素ID值和內容的正則表達式,然後使用preg_match_all函數測試如下: $html = < div id="biuuu">php自學網< /div>< div id="biuuu_2">php自學網2< /div>< div id="biuuu_3">php自學網3< /div>; p......余下全文>>
 

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved