天天看點

python中re子產品(正規表達式子產品)的使用學習

re.match

  • 在字元串的開始位置比對,如果比對成功将傳回MatchObject(值為True),否則傳回None(值為False)。
  • 函數原型
  • 參數說明
    • pattern:正規表達式
    • string:要比對的字元串
    • flags:控制正規表達式的比對方式,如:是否區分大小寫,多行比對等

re.search

  • 檢測整個字元串,找到第一個比對項,如果比對成功将傳回MatchObject(值為True),否則傳回None(值為False)。
  • 函數原型
  • 參數說明
    • pattern:正規表達式
    • string:要比對的字元串
    • flags:控制正規表達式的比對方式,如:是否區分大小寫,多行比對等

re.sub

  • 将字元串中的比對項替換為其他
  • 函數原型
  • 參數說明
    • pattern:正規表達式,比對被替換的項
    • repl:替換為該項
    • string:要比對的字元串
    • count:替換的個數,預設為0時表示全部替換

re.split

  • 根據比對項來分割字元串
  • 函數原型
  • 參數說明
    • pattern:正規表達式
    • string:要比對的字元串
    • maxsplit:最大的分割次數,預設為0時表示全部分割

re.findall

  • 擷取字元串中的所有比對項
  • 函數原型
  • 參數說明
    • pattern:正規表達式
    • string:要比對的字元串

re.compile

  • 把正規表達式(以字元串書寫的)編譯成一個模式對象,提高一定的比對效率,可用來重複使用
  • 函數原型
  • 參數說明
    • pattern:正規表達式

執行個體展示

#!/usr/bin/env python
# -*- coding: utf-8 -*-

"""
功能:學習re子產品
時間:2016年6月1日 18:31:01
"""

import re

text = u"這是一個測試句。這是第二個測試句。這是第三個測試句。"

# re.match
a = re.match(u"這是", text)
print u"match " + a.group() if a else u"not match"

# re.search
b = re.search(u"一個", text)
print u"search " + b.group() if b else u"not search"

# re.sub
c = re.sub(u"測試", u"【測試】", text)
d = re.sub(u"測試", u"【測試】", text, count=)  # 替換一個
print c, "\n", d

# re.split
e = re.split(u"。", text)
print "\n".join(e)
f = re.split(u"(。)", text)  # 加括号表示保留
print "\n".join(f)

# re.findall
g = re.findall(u"[\u4e00-\u9fa5]+。", text)  # 比對中文句子
print "\n".join(g)