一、re子產品
1、作用:根據規則去比對字元串
2、表達式:比對字元串的規則
3、常用方法
findall():【掌握】比對所有的字元串,把比對結果作為一個清單傳回
match():【不用】比對字元串的開始位置,如果開始位置沒有就傳回None
search(): 【不用】在字元串中搜尋,傳回搜尋到的第一個
finditer():【不用】比對所有字元串,傳回疊代器
二、正則比對的分類
1、比對單字元:每次隻比對一個字元
元字元
.:比對任意字元(除\n意外)
[]:比對[]中的任意一個字元
\d:比對數字,0-9
\D:比對非數字
\s(小寫):比對空白(tab鍵、空格)
\S(大寫):比對非空白
\w(小寫):比對非特殊字元(字元、數字、漢字、_)
\W(大寫):比對特殊字元(-、@#¥)
2、多字元比對
貪婪模式:盡可能多的比對
非貪婪模式:盡可能少的比對
元字元
* :比對前一個字元出現0次,或者無限次【貪婪模式】[0--無限次]
+:比對前一個字元出現1次或者無限次,【貪婪模式】[1--無限次]
?:比對前一個字元出現0次或者1次【非貪婪模式】 http(s)
{n}: 比對前一個字元連續出現n次
{n,m}: 比對前一個字元連續出現n-m次
3、邏輯運算
|:兩個條件進行比對,或的關系
4、邊界值
^:比對字元串開始位置
$:比對字元串結束位置
5、分組比對
():隻比對括号裡面的