程式師世界 >> 編程語言 >> JAVA編程 >> 關於JAVA >> 關於JAVA正則表達式的語法詳細解析

關於JAVA正則表達式的語法詳細解析

編輯：關於JAVA

正則表達式是一種文本模式，包括普通字符(例如，a 到 z 之間的字母)和特殊字符(稱為“元字符”)。模式描述在搜索文本時要匹配的一個或多個字符串。

　　正則表達式示例

　　表達式匹配

　　/^\s*$/

　　匹配空行。

　　/\d{2}-\d{5}/

　　驗證由兩位數字、一個連字符再加 5 位數字組成的 ID 號。

　　/《\s*(\S+)(\s[^》]*)?》[\s\S]*《\s*\/\1\s*》/

　　匹配 Html 標記。

　　下表包含了元字符的完整列表以及它們在正則表達式上下文中的行為：

　　字符說明

　　將下一字符標記為特殊字符、文本、反向引用或八進制轉義符。例如，“n”匹配字符“n”。“\n”匹配換行符。序列“\\”匹配“\”，“\(”匹配“(”。

　　匹配輸入字符串開始的位置。如果設置了 RegExp 對象的 Multiline 屬性，^ 還會與“\n”或“\r”之後的位置匹配。

　　匹配輸入字符串結尾的位置。如果設置了 RegExp 對象的 Multiline 屬性，$ 還會與“\n”或“\r”之前的位置匹配。

　　零次或多次匹配前面的字符或子表達式。例如，zo* 匹配“z”和“zoo”。* 等效於 {0，}。

　　一次或多次匹配前面的字符或子表達式。例如，“zo+”與“zo”和“zoo”匹配，但與“z”不匹配。+ 等效於 {1，}。

　　零次或一次匹配前面的字符或子表達式。例如，“do(es)?”匹配“do”或“does”中的“do”。? 等效於 {0，1}。

　　{n}

　　n 是非負整數。正好匹配 n 次。例如，“o{2}”與“Bob”中的“o”不匹配，但與“food”中的兩個“o”匹配。

　　{n，}

　　n 是非負整數。至少匹配 n 次。例如，“o{2，}”不匹配“Bob”中的“o”，而匹配“foooood”中的所有 o。“o{1，}”等效於“o+”。“o{0，}”等效於“o*”。

　　{n，m}

　　M 和 n 是非負整數，其中 n 《= m。匹配至少 n 次，至多 m 次。例如，“o{1，3}”匹配“fooooood”中的頭三個 o。‘o{0，1}’ 等效於 ‘o?’。注意：您不能將空格插入逗號和數字之間。

　　當此字符緊隨任何其他限定符(*、+、?、{n}、{n，}、{n，m})之後時，匹配模式是“非貪心的”。“非貪心的”模式匹配搜索到的、盡可能短的字符串，而默認的“貪心的”模式匹配搜索到的、盡可能長的字符串。例如，在字符串“oooo”中，“o+?”只匹配單個“o”，而“o+”匹配所有 “o”。

　　。

　　匹配除“\n”之外的任何單個字符。若要匹配包括“\n”在內的任意字符，請使用諸如“[\s\S]”之類的模式。

　　(pattern)

　　匹配 pattern 並捕獲該匹配的子表達式。可以使用 $0…$9 屬性從結果“匹配”集合中檢索捕獲的匹配。若要匹配括號字符 ( )，請使用“$”或者“$”。

　　(?：pattern)

　　匹配 pattern 但不捕獲該匹配的子表達式，即它是一個非捕獲匹配，不存儲供以後使用的匹配。這對於用“or”字符 (|) 組合模式部件的情況很有用。例如，‘industr(?：y|ies) 是比 ’industry|industrIEs‘ 更經濟的表達式。

　　(?=pattern)

　　執行正向預測先行搜索的子表達式，該表達式匹配處於匹配 pattern 的字符串的起始點的字符串。它是一個非捕獲匹配，即不能捕獲供以後使用的匹配。例如，’Windows (?=95|98|NT|2000)‘ 匹配“Windows 2000”中的“Windows”，但不匹配“Windows 3.1”中的“Windows”。預測先行不占用字符，即發生匹配後，下一匹配的搜索緊隨上一匹配之後，而不是在組成預測先行的字符後。

　　(?!pattern)

　　執行反向預測先行搜索的子表達式，該表達式匹配不處於匹配 pattern 的字符串的起始點的搜索字符串。它是一個非捕獲匹配，即不能捕獲供以後使用的匹配。例如，’Windows (?!95|98|NT|2000)‘ 匹配“Windows 3.1”中的 “Windows”，但不匹配“Windows 2000”中的“Windows”。預測先行不占用字符，即發生匹配後，下一匹配的搜索緊隨上一匹配之後，而不是在組成預測先行的字符後。

　　x|y

　　匹配 x 或 y。例如，’z|food‘ 匹配“z”或“food”。’(z|f)ood‘ 匹配“zood”或“food”。

　　[xyz]

　　字符集。匹配包含的任一字符。例如，“[abc]”匹配“plain”中的“a”。

　　[^xyz]

　　反向字符集。匹配未包含的任何字符。例如，“[^abc]”匹配“plain”中的“p”。

　　[a-z]

　　字符范圍。匹配指定范圍內的任何字符。例如，“[a-z]”匹配“a”到“z”范圍內的任何小寫字母。

　　[^a-z]

　　反向范圍字符。匹配不在指定的范圍內的任何字符。例如，“[^a-z]”匹配任何不在“a”到“z”范圍內的任何字符。

　　匹配一個字邊界，即字與空格間的位置。例如，“er\b”匹配“never”中的“er”，但不匹配“verb”中的“er”。

　　非字邊界匹配。“er\B”匹配“verb”中的“er”，但不匹配“never”中的“er”。