目錄
一、re.findall函數介紹
二、代碼如下
三、re.findall中正規表達式(.*?)
四、re.findall中參數re.S的意義
關于正規表達式的用法,可參看:劍指 Offer 20. 表示數值的字元串,裡面有更加具體的例子~
一、re.findall函數介紹
它在re.py中有定義:
def findall(pattern, string, flags=0):
"""Return a list of all non-overlapping matches in the string.
If one or more capturing groups are present in the pattern, return
a list of groups; this will be a list of tuples if the pattern
has more than one group.
Empty matches are included in the result."""
return _compile(pattern, flags).findall(string)
傳回string中所有與pattern比對的全部字元串,傳回形式為數組。
二、代碼如下
後面會講解代碼裡的各個部分,先列出來~
import re
str = 'aabbabaabbaa'
#一個"."就是比對除 \n (換行符)以外的任意一個字元
print(re.findall(r'a.b',str))#['aab', 'aab']
#*前面的字元出現0次或以上
print(re.findall(r'a*b',str))#['aab', 'b', 'ab', 'aab', 'b']
#貪婪,比對從.*前面為開始到後面為結束的所有内容
print(re.findall(r'a.*b',str))#['aabbabaabb']
#非貪婪,遇到開始和結束就進行截取,是以截取多次符合的結果,中間沒有字元也會被截取
print(re.findall(r'a.*?b',str))#['aab', 'ab', 'aab']
#非貪婪,與上面一樣,隻是與上面的相比多了一個括号,隻保留括号的内容
print(re.findall(r'a(.*?)b',str))#['a', '', 'a']
str = '''aabbab
aabbaa
bb'''#後面多加了2個b
#沒有把最後一個換行的aab算進來
print(re.findall(r'a.*?b',str))#['aab', 'ab', 'aab']
#re.S不會對\n進行中斷
print(re.findall(r'a.*?b',str,re.S))#['aab', 'ab', 'aab', 'aa\n b']
三、re.findall中正規表達式(.*?)
字元串是
str = 'aabbabaabbaa'
1.一個 . 就 是比對除 \n (換行符)以外的任意一個字元
print(re.findall(r'a.b',str))
['aab', 'aab']
2.* 前面的字元出現0次或以上
print(re.findall(r'a*b',str))
['aab', 'b', 'ab', 'aab', 'b']
3..* 貪婪,比對從.*前面為開始到後面為結束的所有内容
print(re.findall(r'a.*b',str))
['aabbabaabb']
4..*? 非貪婪,遇到開始和結束就進行截取,是以截取多次符合的結果,中間沒有字元也會被截取
print(re.findall(r'a.*?b',str))
['aab', 'ab', 'aab']
5.(.*?) 非貪婪,與上面一樣,隻是與上面的相比多了一個括号,隻保留括号的内容
print(re.findall(r'a(.*?)b',str))
['a', '', 'a']
四、re.findall中參數re.S的意義
1.字元串變為(後面多加了2個b)
str = '''aabbab
aabbaa
bb'''
2.參數無re.S,沒有把最後一個換行的aab算進來
print(re.findall(r'a.*?b',str))
['aab', 'ab', 'aab']
3.參數有re.S,不會對\n進行中斷
print(re.findall(r'a.*?b',str,re.S))
['aab', 'ab', 'aab', 'aa\n b']