天天看點

如何在python中使用正規表達式從多行字元串中删除特定字元

我有一個如下所示的多行字元串:

st = '''emp:firstinfo\n
       :secondinfo\n
       thirdinfo
     '''
print(st)
           

我正在嘗試做的是從我的字元串中跳過第二個’:’,并獲得如下所示的輸出:

'''emp:firstinfo\n
   secondinfo\n
   thirdinfo
   '''
           

簡單說,如果它以’:'開頭,我隻想忽略它。

這是我所做的:

mat_obj = re.match(r'(.*)\n*([^:](.*))\n*(.*)' , st)
print(mat_obj.group())
           

顯然,我沒有看到我的錯誤,但是誰可以幫助我告訴我哪裡出錯了嗎?

1 Answer:

您可以在此正規表達式中使用re.sub:

>>> print (re.sub(r'([^:\n]*:[^:\n]*\n)\s*:(.+)', r'\1\2', st))
emp:firstinfo
secondinfo

       thirdinfo
RegEx Demo
           

正規表達式詳細資訊:

(: 開始第一個捕獲組

[^:\n]: 比對0個或多個不是:的任何字元和換行符

:: 比對冒号

[^:\n]: 比對0個或多個不是:的任何字元和換行符

\n: 比對換行

): 結束第一個捕獲組

\s*: 比對0個或多個空格

::比對一個冒号

(.+): 比對第二個捕獲組中的任何一個或多個字元(換行符除外)

\1\2: 用于替換組1和2中捕獲的子字元串。

2 Answer:

您可以改用sub,隻是不要捕獲不需要的部分。

(.\n)[^:]😦.\n)(.)

替換為

\1\2\3
Regex Demo
import re

regex = r"(.*\n)[^:]*:(.*\n)(.*)"

test_str = ("emp:firstinfo\\n\n"
    "       :secondinfo\\n\n"
    "       thirdinfo")

subst = "\\1\\2\\3"

# You can manually specify the number of replacements by changing the 4th argument
result = re.sub(regex, subst, test_str, 0, re.MULTILINE)