正則表達式,又稱正規表示法、常規表示法(英語:Regular Expression,在代碼中常簡寫為regex、regexp或RE),計算機科學的一個概念。正則表達式使用單個字符串來描述、匹配一系列符合某個句法規則的字符串。在很多文本編輯器裡,正則表達式通常被用來檢索、替換那些符合某個模式的文本。
正則表達式可以干嘛?
1、數據有效性驗證,可以對一個字符串進行測試,看該字符串是否符合某種規定。
2、替換文本,可以在文檔中將指定的文字刪除,或替換為其他文字。
3、根據字符串提取一個子字符串,用來在文本或輸入字段中查找特定文字。
正則表達式語法
一個正則表達式是由普通字符(a-z)和特殊字符(元字符)組成的文字模式,該模式作為一個模版,將某個字符模式與所搜索的字符串進行匹配。
元字符
具有特殊意義的專用字符。
基本元字符
. 匹配除換行以外的任意字符,例如正則表達式 r.t 能夠匹配 “rat、rut、r t”,但是不能匹配root
[] 匹配匹配一個出現在[]中的字符
| 或 敏感詞 ab|cd|ed|df
() 提高優先級 a(bc) 實現分組
限定元字符
* 重復零次或多次
+ 重復一次或多次
? 重復零次或一次
{n} 重復n次
{n,} 重復n次或多次
{n,m} 重復n到m次
首尾元字符
^ 匹配字符串開始 例如正則表達式 ^when 能夠匹配到 ”when in the“ 的開始,但不能匹配到 ”what and when in the“
$ 匹配字符串結束 例如正則表達式 food$ 能夠匹配到 “he's food” 的末尾
簡寫形式
\b 單詞的開始或結束
\d 匹配0-9的數字 \D非數字
\s 任意的空白符 包括tab和換行符 \S大寫 非 空白之外的所有字符
\w 匹配字母、數字或下劃線 \W 非字母、數字下劃線
轉義字符
如果想查找元字符本身的話,比如想查找.或者*就會出現問題,因為會解釋成其他意思。這時就需要使用\來取消這些字符的特殊意義。
因此需要使用\. \* 查找\本身應該寫\\
在javascript中使用正則表達式
創建正則表達式
//字面值
var reg = /\d+/;
//構造函數
var regx = new RegExp(\\d+);
匹配
if(reg.test("45646515"))
{
alert("OK");
}
if(regx.test("sd"))
{
alert("ok")
}
提取
var str="[email protected]";
var reg = /([a-zA-Z0-9]+)@([a-zA-Z0-9]+(\.[a-zA-Z0-9]+)+)/;
var match = reg.exec(str);
alert(match[0]); //[email protected] 匹配到的對象
alert(match[1]); //853020304 [1][2]分別是各個組
alert(match[2]); //qq.com
alert(match[3]); //.com
循環提取
var str = "12345";
var r = /\d\d/g; //g global 全局匹配
var m = r.exec(str); //12
alert(m);
m = r.exec(str); //34
alert(m);
m = r.exec(str); //null 沒有了返回null
alert(m);
var arr = [];
var m = null;
while((m=r.exec(str)) != null) //如果不等於null 繼續循環
{
arr.push(m); //添加到數組
}
alert(arr.length); //[0]=12 [1]=34
替換
string str =
var str = "ab--c--d--e--f-g";
var result = str.replace(/-+/g,','); //如果不寫g 則只替換第一個
alert(result); //ab,c,d,e,f,g
var date = "2015年8月24日";
var result = date.replace(/(\d+)年(\d+)月(\d+)日/,"$1-$2-$3");
alert(result);//2015-8-24
在c#中使用正則表達式
var regx = "^[a-zA-Z0-9]{6,20}$";
if ( ! Regex.IsMatch("abcdef;sd123",regex)
{
//長度必須6-20,字母和數字
}
常用表達式
匹配身份證:\d{15}|\d{18}
匹配中國郵政編碼:[1-9]\d{5}(?!\d)
匹配騰訊QQ號:[1-9][0-9]{4,}
匹配國內電話號碼:\d{3}-\d{8}|\d{4}-\d{7}
匹配帳號是否合法(字母開頭,允許5-16字節,允許字母數字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
匹配網址URL的正則表達式:[a-zA-z]+://[^\s]*
匹配Email地址的正則表達式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
匹配首尾空白字符的正則表達式:^\s*|\s*$
匹配HTML標記的正則表達式:<(\S*?)[^>]*>.*?|<.*? />
匹配中文字符的正則表達式: [\u4e00-\u9fa5]
限制網頁表單裡的文本框輸入內容
只能輸入中文:
<input type="text" onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))" />
只能輸入數字:
<input type="text" onkeyup="value=value.replace(/[^\d]/g,'') " onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))" />
只能輸入數字和英文:
<input type="text" onkeyup="value=value.replace(/[\W]/g,'') " onbeforepaste="clipboardData.setData('text',clipboardData.getData('text).replace(/[^\d]/g,''))" />