正則表達式(Regular Expression)
正則表達式系統:
1.POSIX
2.Perl
PHP中使用的regex是PCRE:
NOTE:PCRE(Perl兼容正則表達式,Perl Compatible Regular Expressions)
PCRE語法:
1.定界符
必須成對出現,可以使用除0-9a-zA-Z\以外的任何字符
2.原子
1.正則需要匹配的可見和不可見字符都是原子
2.一個正則表達式最少含有一個原子
3.當需要匹配諸如"("、"["、"^"等含有語義的符號時需要用"\"反斜線進行轉義
原子字符:
\f 匹配換頁符
\n 匹配換行符
\r 匹配回車符
\t 匹配制表符
\v 匹配垂直制表符
3.元字符
\ 轉義字符
^ 匹配字符串起始處
$ 匹配字符串末尾
. 匹配除"\n"之外的任何單個字符
* 匹配前面的子表達式0或多次
+ 匹配前面的子表達式1次或多次
? 匹配前面的子表達式0次或1次
{n} 匹配n次
{n,} 匹配n次或n次以上
{n,m} 最少匹配n次至多匹配m次,(n<=m)
[] 中括號代表原子表,中間的原子地位都是相等。在匹配的時候,匹配表中的任意一個字符
[^] 抑揚符,排除後面的原子表所包含的字符。
(pattern) 匹配pattern並獲取這一匹配。
\num 對獲取的第num個匹配的引用。
(?:pattern) 匹配pattern但不獲取這一匹配
(?=pattern) 正向肯定預查,非獲取匹配,例如:windows(?=XP|7)能匹配windowsXP中的windows不能匹配windows98中的windows
(?!=pattern) 正向否定欲查非獲取匹配,例如:windows(?!98|2000),能匹配windowsXP中的windows,不能匹配windows98中的windows
(?<=pattern) 反向肯定預查,非獲取匹配。例如:(?<=My|Postgre)SQL能匹配MySQL中的SQL,不能匹配MSSQL中的SQL
(?<!pattern) 反向否定預查,非獲取匹配。例如:(?<!My|Postgre)SQL能匹配MSSQL中的SQL,不能匹配MySQL中的SQL
\b 匹配單詞邊界
\B 匹配除單詞邊界以外的字符
\d 匹配任何一個數字。等價於[0-9]
\D 匹配任何一個非數字以外的字符。等價於[^0-9]
\s 匹配任何一個空白字符(包括空格、制表符、換頁符等)。等價於[\f\n\r\t\v]
\S 匹配任何一個非空白字符。等價於[^\f\n\r\t\v]
\w 匹配任何一個數字、字母或下劃線。等價於[0-9a-zA-Z]
\W 匹配任何一個非數字、字母或下劃線的字符。等價於[^0-9a-zA-Z]
4.模式修正符
i 不區分大小寫
m 此模式中如果有回車或換行,^和$將匹配每行的行首和行尾
s 讓.能匹配\n
x 忽略空白
U 取消貪婪,相當於(.*?)
A 與^效果一樣
D 結尾處不忽略回車 ,在結束處有$符的時候,在匹配的字符串後面加上回車,$依然能夠匹配它成功。但是加上D之後,結尾的回車,不再匹配
NOTE:正則表達式是從左向右進行匹配的
相關函數:
preg_filter — 執行一個正則表達式搜索和替換
preg_grep — 返回匹配模式的數組條目
preg_last_error — 返回最後一個PCRE正則執行產生的錯誤代碼
preg_match_all — 執行一個全局正則表達式匹配
preg_match — 執行一個正則表達式匹配
preg_quote — 轉義正則表達式字符
preg_replace_callback — 執行一個正則表達式搜索並且使用一個回調進行替換
preg_replace — 執行一個正則表達式的搜索和替換
preg_split — 通過一個正則表達式分隔字符串