天天看點

正規表達式學習筆記

轉自CSDN 原連結未知 

1、“.”為通配符,表示任何一個字元,例如:“a.c”可以比對“anc”、“abc”、“acc”;

2、“[]”,在[]内可以指定要求比對的字元,例如:“a[nbc]c”可以比對“anc”、“abc”、“acc”;但不可以比對“ancc”,a到z可以寫成[a-z],0到9可以寫成[0-9];

3、數量限定符号,表示比對次數(或者叫做長度)的符号:

包括:“*”——0次或者多次

      “+”——1次或者多次

      “?”——0次或者1次

      “{n}”——比對n次,n為整數

      “{n,m}”——比對從n到m之間的某個數的次數;n和m都是整數;

      “{n,}”——比對n到無窮次之間任意次數;

      “{,m}”——比對0到m之間任意次數;

他們放到比對格式的後面:

例如:

電話号碼:024-84820482,02484820482(假設前面3或者4位,後面7或者8位,并且中間的減号可有可無)都是符合規定的,那麼可以用如下格式來比對:[0-9]{3,4} \-? [0-9]{7,8};

注意:“\”為轉義字元,因為“-”在正規表達式用有代表一個範圍的意義,例如:前面所說的[0-9],是以它需要轉義字元“\”進行轉義才可使用;

4、“^”為否符号,表示不想比對的符号,例如:[^z][a-z]+可以比對所有除“z”開頭的以外的所有字元串(長度大于2,因為“+”表示大于等于1的次數,從第二位開始都是小寫英文字元);如果^放到[]的外邊則表示以[]開頭的字元串;^[az][a-z]+表示a或者z開頭的長度大于等于2的英文字元串;

5、“|”或運算符,例如:a[n|bc|cb]c可以比對“abcc”,“anc”,“acbc”;

6、“$”以它前面的字元結尾的;例如:ab+$就可以被“abb”,“ab”比對;

7、一些簡單表示方法:

\d表示[0-9];\D表示[^0-9];\w表示[A-Z0-9];\W表示[^A-Z0-9];\s表示[\t\n\r\f],就是空格字元包括tab,空格等等;\S表示[^\t\n\r\f],就是非空格字元;

8、常用的比對:

比對中文字元: “[\u4e00-\u9fa5]”;

比對雙位元組字元(包括漢字在内):“[^\x00-\xff]”;

比對空行的正規表達式:“\n[\s| ]*\r”;

比對HTML标記的正規表達式:“/<(.*)>.*<\/\1>|<(.*) \/>/”;

比對首尾空格的正規表達式:“(^\s*)|(\s*$)”;

比對非負整數(正整數 + 0):“^\d+$”;  

比對正整數:“^[0-9]*[1-9][0-9]*$”;

比對非正整數(負整數 + 0):“^((-\d+)|(0+))$”;

比對負整數:“^-[0-9]*[1-9][0-9]*$”;

比對整數:“^-?\d+$”;

比對非負浮點數(正浮點數 + 0):“^\d+(\.\d+)?$”

比對正浮點數:“^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*

))$”;

^((-\d+(\.\d+)?)|(0+(\.0+)?))$  //比對非正浮點數(負浮點數 + 0)

^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$  //比對負浮點數

比對浮點數:“^(-?\d+)(\.\d+)?$”;

比對由數字、26個英文字母或者下劃線組成的字元串:“^\w+$”;

比對email位址:“^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$”;

比對url:“^[a-zA-z]+://比對(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$”

繼續閱讀