天天看點

Python正規表達式-基礎

Python正規表達式-基礎

本文轉載自昔日暖陽,原文位址:http://www.osheep.cn/4806.html
python使用正則,需要先引入re子產品
import re
           
比對符
單個字元表達式 含義
[0-9] 0123456789任意之一
[a-z] 小寫字母任意之一
[A-Z] 大寫字母任意之一
\d 等同于

[0-9]

\D 等同于

[^0-9]

比對非數字,即

\d

的取反
\w 等同于

[a-z0-9A-Z_]

比對大小寫字母、數字和下劃線
\W 等同于

[^a-z0-9A-Z_]

等同于上一條取反
. 一個任意字元
比對模式
比對模式表達式 含義
? 指定字元一次或者不出現
+ 至少出現一次
* 出現任意次,包括不出現
^ 從字元串開頭進行比對
$ 比對到字元串的結尾
() 分組符、也可用于或比對

案例一:比對郵箱

  • 比對126,163郵箱位址
# 比對126,163郵箱位址
ret = re.match(r"^[0-9a-zA-Z_]{4,20}@(163|126)\.com$", '[email protected]')
if ret:
    print('符合要求 - ', ret.group(), ret.group(1))
else:
    print('不符合要求!')
           

案例二:比對郵箱并進行分組取值

  • 比對126,163郵箱位址
# 使用()對比對值進行分組,可以友善的取得比對值
# 分組1表示@前面的字元串
# 分組2表示163或者126
ret = re.match(r"^([0-9a-zA-Z_]{4,20})@(163|126)\.com$", '[email protected]')
if ret:
    print('符合要求 - ', ret.group(), ret.group(1), ret.group(2))
else:
    print('不符合要求!')
           

案例三:在正規表達式中使用分組

  • 比對網頁源代碼塊
# 在正規表達式中使用分組
# 使用\分組數表示需要使用的分組
ret = re.match(r"^<(\w+)>.*</(\1)>$", '<h1>hello</h1>')
if ret:
    print('符合要求 - ', ret.group())
else:
    print('不符合要求!')
           
  • 使用多個分組
# 在正規表達式中使用分組
# 使用\分組數表示需要使用的分組,這裡表示多個分組
ret = re.match(r"^<(\w+)><(\w+)>.*</(\2)></(\1)>$", '<body><h1>hello</h1></body>')
if ret:
    print('符合要求 - ', ret.group())
else:
    print('不符合要求!')
           

案例四:在正規表達式中對分組進行命名

  • 對分組進行命名 文法:标記分組 ?P 引用分組 ?P=name
# 在正規表達式中使用分組
# 使用\分組數表示需要使用的分組,這裡表示多個分組
ret = re.match(r"^<(?P<p1>\w+)><(?P<p2>\w+)>.*</(?P=p2)></(?P=p1)>$", '<body><h1>hello</h1></body>')
if ret:
    print('符合要求 - ', ret.group())
else:
    print('不符合要求!')
           

轉載于:https://www.cnblogs.com/osheep/p/10707513.html