程式師世界 >> 編程語言 >> JAVA編程 >> 關於JAVA >> 收集的Java正則表達式

收集的Java正則表達式

編輯：關於JAVA

正則表達式是個很不錯的東西，可以讓你使用指定的模式去分析字符串，當年Perl通過提供了類似正則表達式的功能後來獨步武林，好不風光(不過現在主流編程語言都提供了正則表達式功能)，不過它好像看起來比較古怪而且復雜，而且要記住那些操作符好像比較困難，所以從網上搜集了並整理了一下，方便自己也方便你，是吧！：

.　　(匹配任何單個字符。例如正則表達式r.t匹配這些字符串：rat、rut、r　t，但是不匹配root)

$　　(匹配行結束符。例如正則表達式weasel$　能夠匹配字符串"He's　a　weasel"的末尾，但是不能匹配字符串"They　are　a　bunch　of　weasels."。)

^　　(匹配一行的開始。例如正則表達式^When　in能夠匹配字符串"When　in　the　course　of　human　events"的開始，但是不能匹配"What　and　When　in　the"。)

*　　(匹配0或多個正好在它之前的那個字符。例如正則表達式.*意味著能夠匹配任意數量的任何字符。)

\　　(這是引用符，用來將這裡列出的這些元字符當作普通的字符來進行匹配。例如正則表達式\$被用來匹配美元符號，而不是行尾，類似的，正則表達式\.用來匹配點字符，而不是任何字符的通配符)

[　]　[c1-c2]　[^c1-c2]　(匹配括號中的任何一個字符。例如正則表達式r[aou]t匹配rat、rot和rut，但是不匹配ret。可以在括號中使用連字符-來指定字符的區間，例如正則表達式[0-9]可以匹配任何數字字符；還可以制定多個區間，例如正則表達式[A-Za-z]可以匹配任何大小寫字母。另一個重要的用法是“排除”，要想匹配除了指定區間之外的字符——也就是所謂的補集——在左邊的括號和第一個字符之間使用^字符，例如正則表達式[^269A-Z]　將匹配除了2、6、9和所有大寫字母之外的任何字符。)

\<　\>　(匹配詞（word）的開始（\<）和結束（\>）。例如正則表達式\<the能夠匹配字符串"for　the　wise"中的"the"，但是不能匹配字符串"otherwise"中的"the"。注意：這個元字符不是所有的軟件都支持的。)

　　(將　$　和　$　之間的表達式定義為“組”（group），並且將匹配這個表達式的字符保存到一個臨時區域（一個正則表達式中最多可以保存9個），它們可以用　到　的符號來引用。)

|　　(將兩個匹配條件進行邏輯“或”（Or）運算。例如正則表達式(him|her)　匹配"it　belongs　to　him"和"it　belongs　to　her"，但是不能匹配"it　belongs　to　them."。注意：這個元字符不是所有的軟件都支持的。)

+　　(匹配1或多個正好在它之前的那個字符。例如正則表達式9+匹配9、99、999等。注意：這個元字符不是所有的軟件都支持的。)

?　　(匹配0或1個正好在它之前的那個字符。注意：這個元字符不是所有的軟件都支持的。)

\{i\}　　\{i,j\}　　(匹配指定數目的字符，這些字符是在它之前的表達式定義的。例如正則表達式A[0-9]\{3\}　能夠匹配字符"A"後面跟著正好3個數字字符的串，例如A123、A348等，但是不匹配A1234。而正則表達式[0-9]\{4,6\}　匹配連續的任意4個、5個或者6個數字字符。注意：這個元字符不是所有的軟件都支持的。)

匹配中文字符的正則表達式：　[\u4e00-\u9fa5]

匹配雙字節字符(包括漢字在內)：[^\x00-\xff]　（一個雙字節字符長度計2，ASCII字符計1）

匹配空白行的正則表達式：\n\s*\r

匹配手機號碼：^(1[358][0-9]{1})[0-9]{8}$

匹配HTML標記的正則表達式：<(\S*?)[^>]*>.*?</\1>|<.*?　/>　(也僅僅能匹配部分)

匹配首尾空白字符的正則表達式：^\s*|\s*$

匹配Email地址的正則表達式：\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*

匹配網址URL的正則表達式：[a-zA-z]+://[^\s]*

匹配帳號是否合法(字母開頭，允許5-16字節，允許字母數字下劃線)：^[a-zA-Z][a-zA-Z0-9_]{4,15}$

匹配國內電話號碼：\d{3}-\d{8}|\d{4}-\d{7}

匹配騰訊QQ號：[1-9][0-9]{4,}

匹配中國郵政編碼：[1-9]\d{5}(?!\d)