天天看點

正規表達式-Java code

   [size=12px]1。^/d+$  //比對非負整數(正整數 + 0) 2。^[0-9]*[1-9][0-9]*$  //比對正整數 3。^((-/d+)|(0+))$  //比對非正整

數(負整數 + 0) 4。^-[0-9]*[1-9][0-9]*$  //比對負整數 5。^-?/d+$    //比對整數 6。^/d+(/./d+)?$  //比對非負浮點數(正浮

點數 + 0) 7。^(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*))$  //比對正浮點數 8。^((-/d+

(/./d+)?)|(0+(/.0+)?))$  //比對非正浮點數(負浮點數+ 0) 9。^(-(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-

9]*[1-9][0-9]*)))$  //比對負浮點數 10。^(-?/d+)(/./d+)?$  //比對浮點數 11。^[a-za-z]+$  //比對由26個英文字母組成的字元串12

。^[a-z]+$  //比對由26個英文字母的大寫組成的字元串 13。^[a-z]+$  //比對由26個英文字母的小寫組成的字元串 14。^[a-za-z0-9]+$ 

 //比對由數字和26個英文字母組成的字元串 15。^/w+$  //比對由數字、26個英文字母或者下劃線組成的字元串 16。^[/w-]+(/.[/w-]+)*@

[/w-]+(/.[/w-]+)+$    //比對email位址 17。^[a-za-z]+://比對(/w+(-/w+)*)(/.(/w+(-/w+)*))*(/?/s*)?$  //比對url 18。比對中文字

符的正規表達式: [/u4e00-/u9fa5] 19。比對雙位元組字元(包括漢字在内):[^/x00-/xff] 20。應用:計算字元串的長度(一個雙位元組字元長度計2

,ascii字元計1) string.prototype.len=function(){returnthis.replace([^/x00-/xff]/g,"aa").length;} 21。比對空行的正規表達式:/n

[/s| ]*/r 22。比對html标記的正規表達式:/<(.*)>.*<///1>|<(.*)//>/ 23。比對首尾空格的正規表達式:(^/s*)|(/s*$) * 正規表達式用例 *

1、^/s+[a-z a-z]$ 不能為空 不能有空格 隻能是英文字母 * 2、/s{6,} 不能為空 六位以上 * 3、^/d+$ 不能有空格 不能非數字 * 4、(.*)

(/.jpg|/.bmp)$ 隻能是jpg和bmp格式 * 5、^/d{4}/-/d{1,2}-/d{1,2}$隻能是2004-10-22格式 * 6、^0$ 至少選一項 * 7、^0{2,}$ 至少選兩項

* 8、^[/s|/s]{20,}$ 不能為空 二十字以上 * 9、^/+?[a-z0-9](([-+.]|[_]+)?[a-z0-9]+)*@([a-z0-9]+(/.|/-))+[a-z]{2,6}$郵件 * 10、/w+

([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*([,;]/s*/w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*)*輸入多個位址用逗号或空格分隔郵件 *

11、^(/([0-9]+/))?[0-9]{7,8}$電話号碼7位或8位或前面有區号例如(022)87341628 *12、^[a-z a-z 0-9 _]+@[a-z a-z 0-9 _]+(/.[a-z a-z

0-9 _]+)+(/,[a-z a-z 0-9 _]+@[a-z a-z 0-9_]+(/.[a-z a-z 0-9 _]+)+)*$ * 隻能是字母、數字、下劃線;必須有@和.同時格式要規範

郵件 *

13 ^/w+@/w+(/./w+)+(/,/w+@/w+(/./w+)+)*$上面表達式也可以寫成這樣子,更精練。 14 ^/w+((-/w+)|(/./w+))*/@/w+((/.|-)/w+)*/./w+$

[/size]

這隻是做一個簡單的總結,以便自己以後使用起來友善一點

比對中文字元的正規表達式: [/u4e00-/u9fa5]

評注:比對中文還真是個頭疼的事,有了這個表達式就好辦了

比對雙位元組字元(包括漢字在内):[^/x00-/xff]

評注:可以用來計算字元串的長度(一個雙位元組字元長度計2,ascii字元計1)

比對空白行的正規表達式:/n/s*/r

評注:可以用來删除空白行

比對html标記的正規表達式: <(/s*?)[^>]*>.*? ¦ <.*? />

評注:網上流傳的版本太糟糕,上面這個也僅僅能比對部分,對于複雜的嵌套标記依舊無能為力

比對首尾空白字元的正規表達式:^/s* ¦/s*$

評注:可以用來删除行首行尾的空白字元(包括空格、制表符、換頁符等等),非常有用的表達式

比對email位址的正規表達式:/w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*

評注:表單驗證時很實用

比對網址url的正規表達式:[a-za-z]+://[^/s]*

評注:網上流傳的版本功能很有限,上面這個基本可以滿足需求

比對帳号是否合法(字母開頭,允許5-16位元組,允許字母數字下劃線):^[a-za-z][a-za-z0-9_]{4,15}$

比對國内電話号碼:/d{3}-/d{8} ¦/d{4}-/d{7}

評注:比對形式如 0511-4405222 或 021-87888822

比對騰訊qq号:[1-9][0-9]{4,}

評注:騰訊qq号從10000開始

比對中國郵政編碼:[1-9]/d{5}(?!/d)

評注:中國郵政編碼為6位數字

比對身份證:/d{15} ¦/d{18}

評注:中國的身份證為15位或18位

比對ip位址:/d+/./d+/./d+/./d+

評注:提取ip位址時有用

比對特定數字:

^[1-9]/d*$    //比對正整數

^-[1-9]/d*$   //比對負整數

^-?[1-9]/d*$   //比對整數

^[1-9]/d* &brvbar0$  //比對非負整數(正整數 +0)

^-[1-9]/d* &brvbar0$   //比對非正整數(負整數 +0)

^[1-9]/d*/./d* &brvbar0/./d*[1-9]/d*$   //比對正浮點數

^-([1-9]/d*/./d*

&brvbar0/./d*[1-9]/d*)$  //比對負浮點數

^-?([1-9]/d*/./d* &brvbar0/./d*[1-9]/d*

&brvbar0?/.0+ &brvbar0)$  //比對浮點數

^[1-9]/d*/./d* &brvbar0/./d*[1-9]/d*

&brvbar0?/.0+ &brvbar0$   //比對非負浮點數(正浮點數 + 0)

^(-([1-9]/d*/./d*&brvbar0/./d*[1-9]/d*)) &brvbar0?/.0+ &brvbar0$  //比對非正浮點數(負浮點數

+ 0)

評注:處理大量資料時有用,具體應用時注意修正

比對特定字元串:

^[a-za-z]+$  //比對由26個英文字母組成的字元串

^[a-z]+$  //比對由26個英文字母的大寫組成的字元串

^[a-z]+$  //比對由26個英文字母的小寫組成的字元串

^[a-za-z0-9]+$  //比對由數字和26個英文字母組成的字元串

^/w+$  //比對由數字、26個英文字母或者下劃線組成的字元串

"^[//w-]+(//.[//w-]+)*@[//w-]+(//.[//w-]+)+___fckpd___0quot;    //email位址  

"^[a-za-z]+://(//w+(-//w+)*)(//.(//w+(-//w+)*))*(//?//s*)?___fckpd___0quot;  //url

^-([1-9]/d*/./d*&brvbar0/./d*[1-9]/d*)$  //比對負浮點數

^-?([1-9]/d*/./d* &brvbar0/./d*[1-9]/d*&brvbar0?/.0+ &brvbar0)$  //比對浮點數

^[1-9]/d*/./d* &brvbar0/./d*[1-9]/d*&brvbar0?/.0+ &brvbar0$   //比對非負浮點數(正浮點數 + 0)

^(-([1-9]/d*/./d* &brvbar0/./d*[1-9]/d*))&brvbar0?/.0+ &brvbar0$  //比對非正浮點數(負浮點數 + 0)

"^[//w-]+(//.[//w-]+)*@[//w-]+(//.[//w-]+)+___fckpd___0quot;    //email位址

"^[a-za-z]+://(//w+(-//w+)*)(//.(//w+(-//w+)*))*(//?//s*)?___fckpd___0quot;  //urlviewplaincopy to clipboardprint?

正則幾個基本概念:

正則幾個基本概念:view plaincopy to clipboardprint?

1.貪婪:+,*,?,{m,n}等預設是貪婪比對,即盡可能多比對,也叫最大比對

如果後面加上?,就轉化為非貪婪比對,需要高版本支援

如果後面加上?,就轉化為非貪婪比對,需要高版本支援view plaincopy to clipboardprint?

2.擷取:預設用(x&brvbary)是擷取比對,很多時候隻是測試,不一定要求得到所比對的資料,尤其在嵌套比對或大資料中就要用非擷取比對(?:x

&brvbary),這樣提高了效率,優化了程式。

&brvbary),這樣提高了效率,優化了程式。viewplaincopy to clipboardprint?

3.消耗:預設是消耗比對,一般在預查中是非消耗比對。

舉個例子,2003-2-8要變為2003-02-08

如果用/-(/d)-/第二次比對将從8開始,進而隻替換第一個2,錯誤

如果用/-(/d)(?=-)/則第二次比對從第二個-開始,即不消耗字元-

如果用/-(/d)(?=-)/則第二次比對從第二個-開始,即不消耗字元-view plaincopy to clipboardprint?

4.預查:js中分為正向預查和負向預查

如上面的(?=pattern)是正向預查,在任何比對 pattern 的字元串開始處比對查找字元串。還有(?!pattern)是負向預查,在任何不比對 pattern

的字元串開始處比對查找字元串。負向預查有時會用在對[^]的擴充,[^]隻是一些字元,而?!可以使整個字元串。

的字元串開始處比對查找字元串。負向預查有時會用在對[^]的擴充,[^]隻是一些字元,而?!可以使整個字元串。view plaincopy to

clipboardprint?

5.回調:一般用在替換上,即根據不用的比對内容傳回不用的替換值,進而簡化了程式,需要高版本支援

5.回調:一般用在替換上,即根據不用的比對内容傳回不用的替換值,進而簡化了程式,需要高版本支援view plaincopy to clipboardprint?

6.引用:/num 對所擷取的第num個比對的引用。

例如,'(.)/1/1' 比對aaa型。'(.)(.)/2/1' 比對abba型。

例如,'(.)/1/1' 比對aaa型。'(.)(.)/2/1' 比對abba型。view plaincopy to clipboardprint?

正規表達式保留字

^ (carat)  

. (period)  

[ (left bracket}  

$ (dollar sign)  

( (left parenthesis)  

) (right parenthesis)  

¦ (pipe)  

* (asterisk)  

+ (plus symbol)  

? (question mark)  

{ (left curly bracket, or left brace)  

/ backslash

^ (carat)

. (period)

[ (left bracket}

$ (dollar sign)

( (left parenthesis)

) (right parenthesis)

¦ (pipe)

* (asterisk)

+ (plus symbol)

? (question mark)

{ (left curly bracket, or left brace)

/ backslash view plaincopy toclipboardprint?

構造比對于

構造比對于 view plaincopy to clipboardprint?

字元  

x 字元 x  

// 反斜線字元  

/0n 八進制值的字元0n (0 <= n<= 7)  

/0nn 八進制值的字元 0nn (0 <=n <= 7)  

/0mnn 八進制值的字元0mnn 0mnn (0<= m <= 3, 0 <= n <= 7)  

/xhh 十六進制值的字元0xhh  

/uhhhh 十六進制值的字元0xhhhh  

/t 制表符('/u0009')  

/n 換行符 ('/u000a')  

/r 回車符 ('/u000d')  

/f 換頁符 ('/u000c')  

/a 響鈴符 ('/u0007')  

/e 轉義符 ('/u001b')  

/cx t對應于x的控制字元 x

字元

x 字元 x

// 反斜線字元

/0n 八進制值的字元0n (0 <= n<= 7)

/0nn 八進制值的字元 0nn (0 <=n <= 7)

/0mnn 八進制值的字元0mnn 0mnn (0<= m <= 3, 0 <= n <= 7)

/xhh 十六進制值的字元0xhh

/uhhhh 十六進制值的字元0xhhhh

/t 制表符('/u0009')

/n 換行符 ('/u000a')

/r 回車符 ('/u000d')

/f 換頁符 ('/u000c')

/a 響鈴符 ('/u0007')

/e 轉義符 ('/u001b')

/cx t對應于x的控制字元 x viewplaincopy to clipboardprint?

字元類  

[abc] a, b, or c (簡單類)  

[^abc] 除了a、b或c之外的任意 字元(求反)  

[a-za-z] a到z或a到z ,包含(範圍)  

[a-z-[bc]] a到z,除了b和c : [ad-z](減去)  

[a-z-[m-p]] a到z,除了m到 p:[a-lq-z]  

[a-z-[^def]] d, e, 或 f

字元類

[abc] a, b, or c (簡單類)

[^abc] 除了a、b或c之外的任意 字元(求反)

[a-za-z] a到z或a到z ,包含(範圍)

[a-z-[bc]] a到z,除了b和c : [ad-z](減去)

[a-z-[m-p]] a到z,除了m到 p: [a-lq-z]

[a-z-[^def]] d, e, 或 f viewplaincopy to clipboardprint?

預定義的字元類  

. 任意字元(也許能與行終止符比對,也許不能)  

/d 數字: [0-9]  

/d 非數字: [^0-9]  

/s 空格符: [/t/n/x0b/f/r]  

/s 非空格符: [^/s]  

/w 單詞字元:[a-za-z_0-9]  

/w 非單詞字元: [^/w]