Greedy:貪婪的;Reluctant:勉強的;Possessive :獨占的。
測試1:
package jichu; import java.util.regex.Matcher; import java.util.regex.Pattern; public class MainClass { public static void main(String[] args) { Matcher m1 = Pattern.compile("\\w+").matcher("ababa");// 貪婪的 Matcher m2 = Pattern.compile("\\w+?").matcher("ababa");// 勉強的 Matcher m3 = Pattern.compile("\\w++").matcher("ababa");// 獨占的 System.out.println(piPei(m1)); System.out.println(piPei(m2)); System.out.println(piPei(m3)); } public static String piPei(Matcher m) { StringBuffer s = new StringBuffer(); int i = 0; while (m.find()) { s.append("{匹配子串" + ++i + ":" + m.group() + ";"); s.append("開始位置:" + m.start() + ";"); s.append("結束位置:" + m.end() + ";}"); } if (s.length() == 0) { s.append("沒有匹配到!"); } s.insert(0, "(模式" + m.pattern().pattern() + "):"); return s.toString(); } }
打印:
(模式\w+):{匹配子串1:ababa;開始位置:0;結束位置:5;} (模式\w+?):{匹配子串1:a;開始位置:0;結束位置:1;}{匹配子串2:b;開始位置:1;結束位置:2;}{匹配子串3:a;開始位置:2;結束位置:3;}{匹配子串4:b;開始位置:3;結束位置:4;}{匹配子串5:a;開始位置:4;結束位置:5;} (模式\w++):{匹配子串1:ababa;開始位置:0;結束位置:5;}
從測試1中可知:
1、對於貪婪的,會一次性匹配所有的字符;
2、對於勉強的,會從左到右一個一個的匹配;
3、對於獨占的,與貪婪的一樣也是一次性匹配所有的字符;
測試2:(在測試1的基礎上修改main方法)
public static void main(String[] args) { Matcher m1 = Pattern.compile("\\w+b").matcher("ababa");// 貪婪的 Matcher m2 = Pattern.compile("\\w+?b").matcher("ababa");// 勉強的 Matcher m3 = Pattern.compile("\\w++b").matcher("ababa");// 獨占的 System.out.println(piPei(m1)); System.out.println(piPei(m2)); System.out.println(piPei(m3)); }
打印:
(模式\w+b):{匹配子串1:abab;開始位置:0;結束位置:4;} (模式\w+?b):{匹配子串1:ab;開始位置:0;結束位置:2;}{匹配子串2:ab;開始位置:2;結束位置:4;} (模式\w++b):沒有匹配到!
從測試1、2中可知:
1、對於貪婪的,'\w+'已經一次性匹配了所有的字符;當模式後加'b'後,此時不匹配,然後回溯1個字符,匹配成功。
2、對於勉強的,從左到右匹配,匹配出兩個子串。
3、對於獨占的,'\w++'已經一次性匹配了所有的字符;當模式後加'b'後,此時不匹配,與貪婪的不一樣的是它不會回溯,所以匹配失敗。
總結
1、Greedy數量詞為“貪婪的”,如名字一樣,多吃多占,它會盡可能多的匹配字符,會回溯。
2、Reluctant數量詞為“勉強的”,奉行夠用主義,它會盡可能少的匹配字符。
3、Possessive數量詞為“獨占的”,它會如Greedy一樣盡可能多的匹配字符,但是它不會回溯。
更多與正則表達式相關內容:
java正則規則表
java之Pattern類詳解
java之Matcher類詳解