為了抽取或獲得資訊,我們給出抽取操作應遵守的一些規則。這些規則由一些特殊字元或進行模式比對操作時使用的元字元組成。也可以使用規則字元作為模式中的一部分進行搜尋。例如,A将查詢A,x将查找字母x。
以字元出現情況進行比對的表達式,原因是一些系統将這類模式劃分為一組形成基本元字元的集合。
正規表達式預設區分大小寫的,可以通過一個Flag來控制是否區分大小寫。
字元類: 是一組在方括号内的字元,可以比對其中的任何一個字元。
在字元類之外段橫線沒有任何意義,字元内中的^表示非
轉義字元類:
\d == [0-9]
\w == [0-9A-Za-z]
\s 比對一個空字元(空格,制表符,回車,換行)
\D與上面小寫含義相反
\W與上面小寫含義相反
\S與上面小寫含義相反
基本元字元集及其含義
^ 隻比對行首
$ 隻比對行尾
* 一個單字元後緊跟*,比對0個或多個此單字元
[ ] 比對[ ]内字元。可以是一個單字元,也可以是字元序列。可以使用-表示[ ]内字元序列範圍,如用[ 1 - 5 ]代替[ 1 2 3 4 5 ]
\ 用來屏蔽一個元字元的特殊含義。因為有時在s h e l l中一些元字元有特殊含義。\可以使其失去應有意義
. 比對任意單字元
? 比對一個或零個字元
{} 比對重複字元
pattern{n} 用來比對前面p a t t e r n出現次數。n為次數
pattern{n, } 含義同上,但次數最少為n
pattern{n, m} 含義同上,但p a t t e r n出現次數在n與m之間
本文轉自ting2junshui51CTO部落格,原文連結:http://blog.51cto.com/ting2junshui/1729665 ,如需轉載請自行聯系原作者