天天看點

Python/Pandas(十四)-字元串與正則

split拆分常和strip使用

in, find, index 子串定位

find index 的差別是: 如果找不到字元串,index将會引發一個異常, 而不是傳回-1

count 傳回子字元串出現的次數

replace用于将制定模式替換為另一個模式,也常常用于删除模式,傳入空字元串

Python/Pandas(十四)-字元串與正則

re子產品的函數可以分為三個大類: 模式比對,替換以及拆分

調用re.split正規表達式會先被編譯,然後再在text上調用split方法。可以用re.compile自己編譯regex以得到一個可以重用的regex對象

如果希望得到比對到的所有模式,使用findall

findall 傳回字元串中所有的比對項

search 隻傳回第一個比對項

match 隻比對字元串的首部

sub 來替換指定的字元串

groups 傳回模式比對的一組

findall 傳回一個元組清單

Python/Pandas(十四)-字元串與正則