正規表達式的條件與分組的探索——基于python

2023-05-05 03:59:39

本文是關于條件和分組的探索内容，将會在以後新的探索後進行更新，歡迎關注

一、基本符号

分組：()

分組命名：(?P<name> rexp) 将 rexp 比對的字元串作為分組 name

條件：(?(name)Y|N) 當存在分組 name 時，執行 Y 比對，否則執行 N， "|N" 可以省略

二、關于分組命名

先看輸入

caseStr = r'''
    1-test fire
    2:joker_there
    75-just fine
    66:all_right
'''

有兩種格式：“數字 -” ， “數字：”； “數字 -” 比對帶空格的字元串， “數字：”比對不帶空格的字元串

我們以 (?P<ix1>\b\d+\-.*) 來比對 “數字 -” 這樣的模式，并将組名命名為 ix1，得到的輸出為

['1-', '75-']

表示分别将 '1-' 和 '75-' 命名為 ix1 的組

這裡看不出來分組命名的作用，我們往後面走

三、關于條件

現在，我們有了 ix1 分組，我們用他進行條件判斷，正規表達式為

(?P<ix1>\b\d+\-)(?(ix1)([^\n]+))

後面這段 (?(ix1)([^\n]+)) 表示當比對 ix1 成功後，從 ix1 後面繼續比對得到的結果，于是得到以下結果

[('1-', 'test fire'), ('75-', 'just fine')]

四、應用

那麼現在需要想辦法達到我們的目的了：“數字 -” 比對帶空格的字元串， “數字：”比對不帶空格的字元串

這裡引入另外一個好用的擴充表達式，非捕獲

(?:rexp)

表示比對 rexp 表達式的字元串，但是不傳回比對内容

于是，我們最終的解決思路出來了

mStr = r'''

(?:

(?P<ix1>\b\d+\-)

(?(ix1)([^\n]+))

)

(?:

(?P<ix2>\b\d+\:)

(?(ix2)(\w+))

)

'''

傳回結果如下

[('1-', 'test fire', '', ''), ('', '', '2:', 'joker_there'), ('75-', 'just fine', '', ''), ('', '', '66:', 'all_right')]

正規表達式的條件與分組的探索——基于python

如果沒有非捕獲，傳回的結果如下，會将該組内容傳回

[('1-test fire', '1-', 'test fire', '', '', ''), ('', '', '', '2:joker_there', '2:', 'joker_there'), ('75-just fine', '75-', 'just fine', '', '', ''), ('', '', '', '66:all_right', '66:', 'all_right')]

由于非捕獲不能和分組命名/條件嵌套，是以，這已經是部落客能想到的最好的方式了

如果有讀者能夠消除多餘字元串的傳回（直接通過正規表達式達成），歡迎在評論區留言

五、附源碼

#-*-coding:utf8;-*-
import re

caseStr = r'''
1-test fire
2:joker_there
75-just fine
66:all_right
'''

print caseStr

mStr = r'''
(?:
    (?P<ix1>\b\d+\-)
    (?(ix1)([^\n]+))
)
|
(?:
    (?P<ix2>\b\d+\:)
    (?(ix2)(\w+))
)
'''

res = re.findall(mStr, caseStr, re.VERBOSE)

print res

# 2018/06/26 #

發現一個開源的正規表達式工具，叫做Regex101，線上執行，并且有表達式的解釋和常用符号表，還有自己的表達式庫，非常友善

正規表達式的條件與分組的探索——基于python

繼續閱讀

無法解析的外部符号 wmain，該符号在函數 "void cdecl mainCRTStartupHelper(struct HINSTANCE *,unsigned short con......

TestLink導出用例轉換工具(XML2Excel)

YAML簡介和PyYAML安全操作YAML支援的類型YAML的優點：yaml的基本文法python操作

Small tricks

libsvm for python 安裝

學習軟體測試基礎測試第七天

Zeppelin 配置通路 REST APIApache Zeppelin Configuration REST API

【Torch】最簡潔logging使用指南

27. Remove Element(清單)題目代碼

neo4j之cypher使用文檔

Cloud Studio初體驗

使用 ctypes 進行 Python 和 C 的混合程式設計

【python】【資料處理】畫多元資料分布圖

【python】netconf協定對接管理裝置

「Python 網絡自動化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 網絡裝置

在python中建立excel并寫入