天天看点

Python/Pandas(十四)-字符串与正则

split拆分常和strip使用

in, find, index 子串定位

find index 的区别是: 如果找不到字符串,index将会引发一个异常, 而不是返回-1

count 返回子字符串出现的次数

replace用于将制定模式替换为另一个模式,也常常用于删除模式,传入空字符串

Python/Pandas(十四)-字符串与正则

re模块的函数可以分为三个大类: 模式匹配,替换以及拆分

调用re.split正则表达式会先被编译,然后再在text上调用split方法。可以用re.compile自己编译regex以得到一个可以重用的regex对象

如果希望得到匹配到的所有模式,使用findall

findall 返回字符串中所有的匹配项

search 只返回第一个匹配项

match 只匹配字符串的首部

sub 来替换指定的字符串

groups 返回模式匹配的一组

findall 返回一个元组列表

Python/Pandas(十四)-字符串与正则