天天看點

java正則等号轉義_轉義Java正規表達式中的特殊字元

在Java或任何開源庫中是否有任何方法可以轉義(不引用)特殊字元(元字元),以便将其用作正規表達式?

這在動态建構正規表達式時非常友善,無需手動轉義每個單獨的字元 .

例如,考慮一個簡單的正規表達式,如 \d+\.\d+ ,它比對帶小數點的數字,如 1.2 ,以及以下代碼:

String digit = "d";

String point = ".";

String regex1 = "\\d+\\.\\d+";

String regex2 = Pattern.quote(digit + "+" + point + digit + "+");

Pattern numbers1 = Pattern.compile(regex1);

Pattern numbers2 = Pattern.compile(regex2);

System.out.println("Regex 1: " + regex1);

if (numbers1.matcher("1.2").matches()) {

System.out.println("\tMatch");

} else {

System.out.println("\tNo match");

}

System.out.println("Regex 2: " + regex2);

if (numbers2.matcher("1.2").matches()) {

System.out.println("\tMatch");

} else {

System.out.println("\tNo match");

}

毫不奇怪,上面代碼産生的輸出是:

Regex 1: \d+\.\d+

Match

Regex 2: \Qd+.d+\E

No match

也就是說, regex1 比對 1.2 但 regex2 ( Build "dynamically")不比對(相反,它比對文字字元串 d+.d+ ) .

那麼,是否有一種方法可以自動轉義每個正規表達式元字元?

如果有,那麼, java.util.regex.Pattern 中的靜态 escape() 方法,輸出

Pattern.escape('.')

将是字元串 "\." ,但是

Pattern.escape(',')

應該隻生成 "," ,因為它不是元字元 . 同樣的,

Pattern.escape('d')

可以産生 "\d" ,因為 'd' 用于表示數字(雖然在這種情況下轉義可能沒有意義,因為 'd' 可能意味着字面意思 'd' ,這不會被正規表達式的互操作者誤解為其他東西,如同情況一樣 '.' ) .