獲取每次使用引起小損失的分組。如果你實際並不需要獲取一個分組內的文本,那麼 就使用非捕獲分組。例如使用“(?:X)”代替“(X)”。
讓引擎完成優化(Let the engine do the work for you)
如上面我所提到的,java.util.regex包可以編JAVA譯正則表達式時對其優化。例如, 正則表達式中包含了一個必須在輸入字符串中出現的字符串(或者整個表達式都不匹配) ,引擎有時會首先搜索該字符串,如果沒有找到匹配就會報告失敗,不再檢查整個正則表 達式。
另外非常有用地自動優化正則表達式的方式讓引擎根據正則表達式中的期望長度檢查 輸入字符串的長度。例如,表達式“\d{100}”是內在優化的,以致於如果輸入 字符串不是JAVA100個字符,引擎就會報告失敗,而不再考察整個正則表達式。
無論何時編寫復雜的正則表達式時,嘗試找出一種編寫方式使引擎可以識別和優化這 些特殊情況。例如,不要在分組或選擇中隱藏命令字符串,因為引擎不會識別它們。若有 可能,指定你想要匹JAVA配的輸入字符串的長度也是相當有用的,如上例所示。
優化貪婪模式和勉強模式(Optimizing greedy and reluctant quantifiers)
你已經有了如何優化正則表達式的基本概念,其中一些方式可以JAVA讓引擎來完成優 化。現在我們討論優化貪婪模式和勉強模式。貪婪模式量詞如“*”或 “+”,會首先從輸入字符串中嘗試匹配盡可能多的字符,即使這意味著字符 串中的剩下的內容已經不足以匹配正則表達式的其余部分。如果是這樣,貪婪模式量詞就 會回縮,返回字符,知道可以完全匹配或者沒有字符了。勉強(或者lazy)模式,另一方 面,會首先嘗試匹配輸入字符串中盡可能少的字符。