pandas(五):正则表达式

标签:
it |
分类: 利用python进行数据分析 |
正则模块中的函数功能大致有3类: matching,substitution,splitting;
2) match()
- re.split(pattern,text) #按照pattern将text切割,以列表返回
2) match()
写法一:
re.match(pattern, text) #如果pattern在text的开头匹配,返回;否则返回None
写法二:
regex = re.compile(pattern,flags=re.IGNORECASE)
#re.IGNORECASE为忽略大小写
matches=regex.match(text) #在text开头匹配pattern
matches.groups()#返回开头模式匹配的各个组
http://s8/mw690/004mfPsMzy7nevSOtQr17&690
http://s15/mw690/004mfPsMzy7new8Pcaa8e&690
http://s6/mw690/004mfPsMzy7newHSJE165&690
http://s14/mw690/004mfPsMzy7newPv7mRdd&690
http://s15/mw690/004mfPsMzy7new8Pcaa8e&690
http://s6/mw690/004mfPsMzy7newHSJE165&690
http://s14/mw690/004mfPsMzy7newPv7mRdd&690
3)search()
#写法与match()一样,同样有两种;在整个text中匹配pattern,返回第一个匹配子字符串的位置;
- substitution
写法一:
re.sub(pattern,'substitution',text)
写法二:
regex= re.compile(pattern,flags=re.IGNORECASE)
regex.sub('substitution',text)