匹配中文字符的正則表達式:
程序代碼
[\u4e00-\u9fa5]
評注:匹配中文還真是個頭疼的事,有了這個表達式就好辦了
匹配雙字節字符(包括漢字在內):
程序代碼
[^\x00-\xff]
評注:可以用來計算字符串的長度(一個雙字節字符長度計2,ASCII字符計1)
匹配空白行的正則表達式:
程序代碼
\n\s*\r
評注:可以用來刪除空白行
匹配Html標記的正則表達式:
程序代碼
<(\S*?)[^>]*>.*?|<.*? />
評注:網上流傳的版本太糟糕,上面這個也僅僅能匹配部分,對於復雜的嵌套標記依舊無能為力
匹配首尾空白字符的正則表達式:
程序代碼
^\s*|\s*$
評注:可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等),非常有用的表達式
匹配Email地址的正則表達式:
程序代碼
\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
評注:表單驗證時很實用
匹配網址URL的正則表達式:
程序代碼
[a-zA-z]+://[^\s]*
評注:網上流傳的版本功能很有限,上面這個基本可以滿足需求
匹配二級或多級域名的主域名
([a-z0-9][a-z0-9\-]*?\.(?:com|cn|net|org|gov|info|la|cc|co)(?:\.(?:cn|jp))?)$
匹配帳號是否合法(字母開頭,允許5-16字節,允許字母數字下劃線):
程序代碼
^[a-zA-Z][a-zA-Z0-9_]{4,15}$
評注:表單驗證時很實用
匹配國內電話號碼:
程序代碼
\d{3}-\d{8}|\d{4}-\d{7}
評注:匹配形式如 0511-4405222 或 021-87888822
匹配騰訊QQ號:
程序代碼
[1-9][0-9]{4,}
評注:騰訊QQ號從10000開始
匹配中國郵政編碼:
程序代碼
[1-9]\d{5}(?!\d)
評注:中國郵政編碼為6位數字
匹配身份證:
程序代碼
\d{15}|\d{18}
評注:中國的身份證為15位或18位
匹配ip地址:
程序代碼
\d+\.\d+\.\d+\.\d+
評注:提取ip地址時有用
匹配特定數字:
程序代碼
^[1-9]\d*$ //匹配正整數
^-[1-9]\d*$ //匹配負整數
^-?[1-9]\d*$ //匹配整數
^[1-9]\d*|0$ //匹配非負整數(正整數 + 0)
^-[1-9]\d*|0$ //匹配非正整數(負整數 + 0)
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ //匹配正浮點數
^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ //匹配負浮點數
^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$ //匹配浮點數
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$ //匹配非負浮點數(正浮點數 + 0)
^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$ //匹配非正浮點數(負浮點數 + 0)
評注:處理大量數據時有用,具體應用時注意修正
匹配特定字符串:
程序代碼
^[A-Za-z]+$ //匹配由26個英文字母組成的字符串
^[A-Z]+$ //匹配由26個英文字母的大寫組成的字符串
^[a-z]+$ //匹配由26個英文字母的小寫組成的字符串
^[A-Za-z0-9]+$ //匹配由數字和26個英文字母組成的字符串
^\w+$ //匹配由數字、26個英文字母或者下劃線組成的字符串
在使用 RegularExpressionValidator 驗證控件時的驗證功能及其驗證表達式介紹如下:
只能輸入數字:
程序代碼
^[0-9]*$
只能輸入n位的數字:
程序代碼
^\d{n}$
只能輸入至少n位數字:
程序代碼
^\d{n,}$
只能輸入m-n位的數字:
程序代碼
^\d{m,n}$
只能輸入零和非零開頭的數字:
程序代碼
^(0|[1-9][0-9]*)$
只能輸入有兩位小數的正實數:
程序代碼
^[0-9]+(.[0-9]{2})?$
只能輸入有1-3位小數的正實數:
程序代碼
^[0-9]+(.[0-9]{1,3})?$
只能輸入非零的正整數:
程序代碼
^\+?[1-9][0-9]*$
只能輸入非零的負整數:
程序代碼
^\-[1-9][0-9]*$
只能輸入長度為3的字符:
程序代碼
^.{3}$
只能輸入由26個英文字母組成的字符串:
程序代碼
^[A-Za-z]+$
只能輸入由26個大寫英文字母組成的字符串:
程序代碼
^[A-Z]+$
只能輸入由26個小寫英文字母組成的字符串:
程序代碼
^[a-z]+$
只能輸入由數字和26個英文字母組成的字符串:
程序代碼
^[A-Za-z0-9]+$
只能輸入由數字、26個英文字母或者下劃線組成的字符串:
程序代碼
^\w+$
只能輸入漢字:
程序代碼
^[\u4e00-\u9fa5],{0,}$
驗證用戶密碼:
程序代碼
^[a-zA-Z]\w{5,17}$
正確格式為:以字母開頭,長度在6-18之間,只能包含字符、數字和下劃線。
驗證是否含有^%&',;=?$\等字符:
程序代碼
[^%&',;=?$\x22]+
驗證Email地址:
程序代碼
^\w+[-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
驗證InternetURL:
程序代碼
^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$
驗證電話號碼:
程序代碼
^(\(\d{3,4}\)|\d{3,4}-)?\d{7,8}$
正確格式為:XXXX-XXXXXXX,XXXX-XXXXXXXX,XXX-XXXXXXX, XXX-XXXXXXXX,XXXXXXX,XXXXXXXX
驗證身份證號(15位或18位數字):
程序代碼
^\d{15}|\d{}18$
驗證一年的12個月:
程序代碼
^(0?[1-9]|1[0-2])$
正確格式為:01-09和112
驗證一個月的31天:
程序代碼
^((0?[1-9])|((1|2)[0-9])|30|31)$
正確格式為:0109和131-----------------------常用的匹配正則表達式和實例--------------------------------
匹配中文字符的正則表達式:
程序代碼
[\u4e00-\u9fa5]
匹配雙字節字符(包括漢字在內):
程序代碼
[^\x00-\xff]
應用:計算字符串的長度(一個雙字節字符長度計2,ASCII字符計1)
程序代碼
String.prototype.len=function(){return this.replace([^\x00-\xff]/g,"aa").length;}
匹配空行的正則表達式:
程序代碼
\n[\s| ]*\r
匹配Html標記的正則表達式:
程序代碼
/<(.*)>.*<\/\1>|<(.*) \/>/
匹配首尾空格的正則表達式:
程序代碼
(^\s*)|(\s*$)
應用:Javascript中沒有像vbscript那樣的trim函數,我們就可以利用這個表達式來實現,如下:
程序代碼
String.prototype.trim = function()
{
return this.replace(/(^\s*)|(\s*$)/g, "");
}
利用正則表達式分解和轉換IP地址:
下面是利用正則表達式匹配IP地址,並將IP地址轉換成對應數值的Javascript程序:
程序代碼
function IP2V(ip)
{
re=/(\d+)\.(\d+)\.(\d+)\.(\d+)/g //匹配IP地址的正則表達式
if(re.test(ip))
{
return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1
}
else
{
throw new Error("Not a valid IP address!")
}
}
不過上面的程序如果不用正則表達式,而直接用split函數來分解可能更簡單,程序如下:
http://bizhi.knowsky.com/
程序代碼
var ip="10.100.20.168"
ip=ip.split(".")
alert("IP值是:"+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))
匹配Email地址的正則表達式:
程序代碼
\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
匹配網址URL的正則表達式:
程序代碼
http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?
匹配區號、分機號的固定電話正則表達式:
程序代碼
/^((0\d{2,3})-)(\d{7,8})(-(\d{3,}))?$/
手機號碼前面以1開頭,第二位現在是3或者5,後面是9位數字,則:
程序代碼
/^1[35]\d{9}$/
更強悍的固定電話號碼正則表達式:
程序代碼
(^(\d{2,4}[-_-—]?)?\d{3,8}([-_-—]?\d{3,8})?([-_-—]?\d{1,7})?$)|(^0?1[35]\d{9}$)
該表達式可以驗證那些不小心把連接符“-”寫出“-”的或者下劃線“_”的等等。
利用正則表達式去除字串中重復的字符的算法程序:[注:此程序不正確,原因見本貼回復]
程序代碼
var s="abacabefgeeii"
var s1=s.replace(/(.).*\1/g,"$1")
var re=new RegExp("["+s1+"]","g")
var s2=s.replace(re,"")
alert(s1+s2) //結果為:abcefgi
我原來在CSDN上發貼尋求一個表達式來實現去除重復字符的方法,最終沒有找到,這是我能想到的最簡單的實現方法。思路是使用後向引用取出包括重復的字符,再以重復的字符建立第二個表達式,取到不重復的字符,兩者串連。這個方法對於字符順序有要求的字符串可能不適用。
得用正則表達式從URL地址中提取文件名的Javascript程序,如下結果為page1
程序代碼
s="http://www.9499.Net/page1.htm"
s=s.replace(/(.*\/){0,}([^\.]+).*/ig,"$2")
alert(s)
利用正則表達式限制網頁表單裡的文本框輸入內容:
用正則表達式限制只能輸入中文:
程序代碼
onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,)" onbeforepaste="clipboardData.setData(text,clipboardData.getData(text).replace(/[^\u4E00-\u9FA5]/g,))"
用正則表達式限制只能輸入全角字符:
程序代碼
onkeyup="value=value.replace(/[^\uFF00-\uFFFF]/g,)" onbeforepaste="clipboardData.setData(text,clipboardData.getData(text).replace(/[^\uFF00-\uFFFF]/g,))"
用正則表達式限制只能輸入數字:
程序代碼
onkeyup="value=value.replace(/[^\d]/g,) "onbeforepaste="clipboardData.setData(text,clipboardData.getData(text).replace(/[^\d]/g,))"
用正則表達式限制只能輸入數字和英文:
程序代碼
onkeyup="value=value.replace(/[\W]/g,) "onbeforepaste="clipboardData.setData(text,clipboardData.getData(text).replace(/[^\d]/g,))"
程序代碼
^\d+$ //匹配非負整數(正整數 + 0)
^[0-9]*[1-9][0-9]*$ //匹配正整數
^((-\d+)|(0+))$ //匹配非正整數(負整數 + 0)
^-[0-9]*[1-9][0-9]*$ //匹配負整數
^-?\d+$ //匹配整數
^\d+(\.\d+)?$ //匹配非負浮點數(正浮點數 + 0)
^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$ //匹配正浮點數
^((-\d+(\.\d+)?)|(0+(\.0+)?))$ //匹配非正浮點數(負浮點數 + 0)
^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$ //匹配負浮點數
^(-?\d+)(\.\d+)?$ //匹配浮點數
^[A-Za-z]+$ //匹配由26個英文字母組成的字符串
^[A-Z]+$ //匹配由26個英文字母的大寫組成的字符串
^[a-z]+$ //匹配由26個英文字母的小寫組成的字符串
^[A-Za-z0-9]+$ //匹配由數字和26個英文字母組成的字符串
^\w+$ //匹配由數字、26個英文字母或者下劃線組成的字符串
^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$ //匹配email地址
^[a-zA-z]+://匹配(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$ //匹配url
------------------------------------
利用正則表達式去除字串中重復的字符的算法程序:
程序代碼
var s="abacabefgeeii"
var s1=s.replace(/(.).*\1/g,"$1")
var re=new RegExp("["+s1+"]","g")
var s2=s.replace(re,"")
alert(s1+s2) //結果為:abcefgi
===============================
如果var s = "abacabefggeeii"
結果就不對了,結果為:abeicfgg
正則表達式的能力有限
----------------------------------------------------------
程序代碼
Function Extension(url As String) As String
Dim r As New Regex("^(?<proto>\w+)://[^/]+?(?<port>:\d+)?/", _
RegexOptions.Compiled)
Return r.Match(url).Result("${proto}${port}")
End Function
20090701更新:
超強悍的IP地址驗證正則表達式:
程序代碼
^(0|[1-9]\d?|[0-1]\d{2}|2[0-4]\d|25[0-5]).(0|[1-9]\d?|[0-1]\d{2}|2[0-4]\d|25[0-5]).(0|[1-9]\d?|[0-1]\d{2}|2[0-4]\d|25[0-5]).(0|[1-9]\d?|[0-1]\d{2}|2[0-4]\d|25[0-5])$
支持n級域名判斷的正則表達式:
程序代碼
^(([^-][a-z0-9A-Z-_]+\.)*)[^-][a-z0-9A-Z-_]+(\.[a-zA-Z]{2,4}){1,2}$
二級域名正則表達式 分析+分割 URL的正則表達式:
程序代碼
(\w+:\/\/)?([^\.]+)(\.[^/:]+)(:\d*)?([^# ]*)
第一個附加子表達式($1)是用來捕獲該 web 地址的協議部分。該子表達式匹配位於包括一個冒號和兩個正斜槓之前的任何單詞。
第二個附加子表達式($2)捕獲該地址的二級域名地址。該子表達式匹配不包括 '.' 字符的任何字符序列。
第三個附加子表達式($3)捕獲該地址的域名地址。該子表達式匹配不包括 '/' 或 ':' 字符的任何字符序列。
第四個附加子表達式($4)捕獲網站端口號碼,如果指定了該端口號。該子表達式匹配後跟一個冒號的零或多個數字。
第五個附加子表達式($5)捕獲由該 web 地址指定的路徑以及\或者頁面信息。該子表達式匹配一個和多個除'#' 或空格之外的字符。
將該正則表達式應用於http://www.dlstu.cn:80/code/default.ASP?id=1056所示的URI 後,子匹配包含如下內容:
RegExp.$0 包含 "http://www.dlstu.cn:80/code/default.ASP?id=1056"
RegExp.$1 包含 "http://"
RegExp.$2 包含 "www"
RegExp.$3 包含 ".dlstu.cn"
RegExp.$4 包含 ":80"
RegExp.$5 包含 "/code/default.ASP?id=1056"
超強悍的URL網址驗證正則表達式,幾乎可以匹配目前所有的常見網址協議,可以擴充更多以支持其他下載協議等:
程序代碼
^((https|http|FTP|rtsp|mms)?://)?(([0-9a-z_!~*'().&=+$%-]+: )?[0-9a-zA-Z_!~*'().&=+$%-]+@)?(([0-9]{1,3}\.){3}[0-9]{1,3}|([0-9a-zA-Z_!~*'()-]+\.)*([0-9a-zA-Z][0-9a-zA-Z-]{0,61})?[0-9a-z]\.[a-zA-Z]{2,6})(:[0-9]{1,4})?((/?)|(/[0-9a-zA-Z_!~*'().;?:@&=+$,%#-]+)+/?)$