1
2
3
4
5
6
7
8
9
10
<code>>>>aa</code><code>=</code><code>"hi"</code>
<code>>>>num</code><code>=</code><code>[</code><code>0</code><code>,</code><code>1</code><code>,</code><code>2</code><code>,</code><code>3</code><code>,</code><code>4</code><code>,</code><code>5</code><code>]</code>
<code>>>></code><code>for</code> <code>i </code><code>in</code> <code>num :</code>
<code> </code><code>if</code> <code>i ></code><code>0</code><code>:</code>
<code> </code><code>print</code><code>(aa)</code>
<code>hi</code>
上面这个就是实现“把某个字符串,反复出现某list里满足条件的元素次数”,这个得到的结果是一个str,如果要简化一下这段代码如下:
<code>>>>[aa </code><code>for</code> <code>i </code><code>in</code> <code>num </code><code>if</code> <code>i ></code><code>0</code><code>]</code>
<code>[hi,hi,hi,hi,hi]</code>
这里一定要有中括号,不然的话算SyntaxError: invalid syntax。得到的结果是一个list。
replace函数
一般情况下来说,对于字符串的替换,常用的都是.replace函数。replace()可以设定替换次数。
<code>>>> aaa</code><code>=</code><code>"wade,james,kobe,lewis,kevin"</code>
<code>>>> s</code><code>=</code><code>aaa.replace(</code><code>"james"</code><code>,</code><code>"curry"</code><code>)</code>
<code>'wade,curry,kobe,lewis,kevin'</code>
<code>>>></code><code>type</code><code>(s)</code>
<code><</code><code>class</code> <code>'str'</code><code>></code>
<code>>>> champions</code><code>=</code><code>'warriors,spurs,heat,heat,mavericks,lakers,lakers,celtics,spurs'</code>
<code>>>> champions.replace(</code><code>"spurs"</code><code>,</code><code>"马刺队"</code><code>,</code><code>1</code><code>) </code><code>#只替换一次</code>
<code>'warriors,马刺队,heat,heat,mavericks,lakers,lakers,celtics,spurs'</code>
<code>>>> champions.replace(</code><code>"spurs"</code><code>,</code><code>"马刺队"</code><code>,</code><code>2</code><code>) </code><code>#替换两次</code>
<code>'warriors,马刺队,heat,heat,mavericks,lakers,lakers,celtics,马刺队'</code>
rm.sub模块
sub模块主要是字符串的针对性替换作用,在这一点上sub()和replace()的功能类似的,但是sub()支持正则表达式。使用格式是text.sub(r"要替换的内容","替换成的内容",替换范围),举个例子:
<code>>>></code><code>import</code> <code>re</code>
<code>>>>s0</code><code>=</code><code>"james and wade"</code>
<code>>>>s1</code><code>=</code><code>re.sub(r</code><code>"james"</code><code>,</code><code>"bosh"</code><code>,s0) </code><code>#r指的是原生字符串的意思</code>
<code>>>></code><code>print</code><code>(s1)</code>
<code>bosh </code><code>and</code> <code>wade</code>
sub模块支持 | 的引用,比如把上面代码修改一下:
<code>>>>s2</code><code>=</code><code>re.sub(r</code><code>"james|wade"</code><code>,</code><code>"bosh"</code><code>,s0) </code><code># | 就是或的意思</code>
<code>>>></code><code>print</code><code>(s2)</code>
<code>bosh </code><code>and</code> <code>bosh</code>
但是要注意,如果类似于linux里的或,用[]括起来的话,结果可大不相同:
<code>>>>s3</code><code>=</code><code>re.sub(r</code><code>"[james|kobe]"</code><code>,</code><code>"bosh"</code><code>,s0) </code><code># 这里原来打算把james或者kobe替换成bosh</code>
<code>>>></code><code>print</code><code>(s3)</code>
<code>boshboshboshboshbosh boshnd wboshdbosh </code>
<code>#可以看出只要是 j a m e s k o b e这几个字母就都变成了bosh,而出现了boshnd,是应为n和d 不属于上面几个字母,所以nd保留了下来。</code>
如果要把每一项都改,可以用[a-z],
<code>>>>s4</code><code>=</code><code>re.sub(r</code><code>"[a-z]"</code><code>,</code><code>"bosh"</code><code>,s0)</code>
<code>>>></code><code>print</code><code>(s4)</code>
<code>boshboshboshboshbosh boshboshbosh boshboshboshbosh</code>
那么对于数字而言,就是[1-9],但是有没有一种方式,把所有的元素都包括了呢?有的,那就是\w
<code>>>>s0</code><code>=</code><code>"james23 and wade3"</code> <code>#这是一个混杂型的字符串,里面有数字、字母</code>
<code>>>>s5</code><code>=</code><code>re.sub(r</code><code>"\w"</code><code>,</code><code>"bosh"</code><code>,s0)</code>
<code>>>></code><code>print</code><code>(s5)</code>
\w对于“@#¥%^$”特殊符号是不好使的。
re还有一个subn的模块,再看看这个。
<code>>>> </code><code>import</code> <code>re</code>
<code>>>> s</code><code>=</code><code>"1abc23def45"</code>
<code>>>> </code><code>print</code><code>(</code><code>str</code><code>(re.subn(r</code><code>"\w"</code><code>,</code><code>"hi"</code><code>,s)[</code><code>1</code><code>]))</code>
<code>11</code> <code>#这个是体现了一共替换了多少次,</code>
<code>>>> </code><code>print</code><code>(</code><code>str</code><code>(re.subn(r</code><code>"\w"</code><code>,</code><code>"hi"</code><code>,s)[</code><code>0</code><code>]))</code>
<code>hihihihihihihihihihihi </code><code>#只有[0]和[1],[0]是替换的内容。</code>
<code>>>> </code><code>print</code><code>(</code><code>str</code><code>(re.subn(r</code><code>"\w"</code><code>,</code><code>"hi"</code><code>,s)))</code>
<code>(</code><code>'hihihihihihihihihihihi'</code><code>, </code><code>11</code><code>)</code>
<code>>>> </code><code>print</code><code>(</code><code>str</code><code>(re.subn(r</code><code>"[a-z]"</code><code>,</code><code>"hi"</code><code>,s)))</code>
<code>(</code><code>'1hihihi23hihihi45'</code><code>, </code><code>6</code><code>)</code>
对于字符串的基本操作:http://blog.csdn.net/minsenwu/article/details/7891453
本文转自 苏幕遮618 51CTO博客,原文链接:http://blog.51cto.com/chenx1242/1767268