天天看點

轉載1-Python 字元串操作

Python 字元串操作(string替換、删除、截取、複制、連接配接、比較、查找、包含、大小寫轉換、分割等)

1、去空格及特殊符号
 
s.strip()
s.lstrip()
s.rstrip()
s.strip().lstrip().rstrip(',')
 
  聲明:s為字元串,rm為要删除的字元序列
  s.strip(rm)        删除s字元串中開頭、結尾處,位于 rm删除序列的字元
  s.lstrip(rm)       删除s字元串中開頭處,位于 rm删除序列的字元
  s.rstrip(rm)       删除s字元串中結尾處,位于 rm删除序列的字元
 
2、複制字元串
 
#strcpy(str1,str2)
str1 = 'strcpy'
str2 = str1
str1 = 'strcpy2'
print str2
 
3、連接配接字元串
 
#strcat(str1,str2)
str1 = 'strcat'
str2 = 'append'
str1 += str2
print str1
 
4、查找字元
 
#strchr(str1,str2)
# < 0 為未找到
str1 = 'strchr'
str2 = 's'
nPos = str1.index(str2)
print nPos
 
5、比較字元串
 
#strcmp(str1,str2)
str1 = 'strchr'
str2 = 'strch'
print cmp(str1,str2)
 
6、掃描字元串是否包含指定的字元
 
#strspn(str1,str2)
str1 = '12345678'
str2 = '456'
#str1 and chars both in str1 and str2
print len(str1 and str2)
 
7、字元串長度
 
#strlen(str1)
str1 = 'strlen'
print len(str1)
 
8、将字元串中的大小寫轉換
 
S.lower() #小寫 
S.upper() #大寫 
S.swapcase() #大小寫互換 
S.capitalize() #首字母大寫 
String.capwords(S) #這是子產品中的方法。它把S用split()函數分開,然後用capitalize()把首字母變成大寫,最後用join()合并到一起 
#執行個體:
#strlwr(sStr1)
str1 = 'JCstrlwr'
str1 = str1.upper()
#str1 = str1.lower()
print str1
 
9、追加指定長度的字元串
 
#strncat(str1,str2,n)
str1 = '12345'
str2 = 'abcdef'
n = 3
str1 += str2[0:n]
print str1
 
10、字元串指定長度比較
 
#strncmp(str1,str2,n)
str1 = '12345'
str2 = '123bc'
n = 3
print cmp(str1[0:n],str2[0:n])
 
11、複制指定長度的字元
 
#strncpy(str1,str2,n)
str1 = ''
str2 = '12345'
n = 3
str1 = str2[0:n]
print str1
 
12、将字元串前n個字元替換為指定的字元
 
str1 = '12345'
ch = 'r'
n = 3
str1 = n * ch + str1[3:]
print str1
 
13、掃描字元串
 
#strpbrk(str1,str2)
str1 = 'cekjgdklab'
str2 = 'gka'
nPos = -1
for c in str1:
    if c in str2:
        nPos = str1.index(c)
        break
print nPos
 
14、翻轉字元串
 
#strrev(str1)
str1 = 'abcdefg'
str1 = str1[::-1]
print str1
 
15、查找字元串
 
#strstr(str1,str2)
str1 = 'abcdefg'
str2 = 'cde'
print str1.find(str2)
 
16、分割字元串
 
#strtok(str1,str2)
str1 = 'ab,cde,fgh,ijk'
str2 = ','
str1 = str1[str1.find(str2) + 1:]
print str1
#或者
s = 'ab,cde,fgh,ijk'
print(s.split(','))
 
17、連接配接字元串
 
delimiter = ','
mylist = ['Brazil', 'Russia', 'India', 'China']
print delimiter.join(mylist)
 
18、PHP 中 addslashes 的實作
 
def addslashes(s):
    d = {'"':'\\"', "'":"\\'", "\0":"\\\0", "\\":"\\\\"}
    return ''.join(d.get(c, c) for c in s)

s = "John 'Johny' Doe (a.k.a. \"Super Joe\")\\\0"
print s
print addslashes(s)
 
19、隻顯示字母與數字
 
def OnlyCharNum(s,oth=''):
    s2 = s.lower();
    fomart = 'abcdefghijklmnopqrstuvwxyz0123456789'
    for c in s2:
        if not c in fomart:
            s = s.replace(c,'');
    return s;

print(OnlyStr("a000 aa-b"))
 
20、截取字元串
 
str = '0123456789'
print str[0:3]    #截取第一位到第三位的字元
print str[:]      #截取字元串的全部字元
print str[6:]     #截取第七個字元到結尾
print str[:-3]    #截取從頭開始到倒數第三個字元之前
print str[2]      #截取第三個字元
print str[-1]     #截取倒數第一個字元
print str[::-1]   #創造一個與原字元串順序相反的字元串
print str[-3:-1]  #截取倒數第三位與倒數第一位之前的字元
print str[-3:]    #截取倒數第三位到結尾
print str[:-5:-3] #逆向截取,倒數第一位與倒數第五位之間的字元,步長為3
 
21、字元串在輸出時的對齊
 
S.ljust(width,[fillchar]) 
#輸出width個字元,S左對齊,不足部分用fillchar填充,預設的為空格。 
S.rjust(width,[fillchar]) #右對齊 
S.center(width, [fillchar]) #中間對齊 
S.zfill(width) #把S變成width長,并在右對齊,不足部分用0補足
 
22、字元串中的搜尋和替換 
 
S.find(substr, [start, [end]]) 
#傳回S中出現substr的第一個字母的标号,如果S中沒有substr則傳回-1。start和end作用就相當于在S[start:end]中搜尋 
S.index(substr, [start, [end]]) 
#與find()相同,隻是在S中沒有substr時,會傳回一個運作時錯誤 
S.rfind(substr, [start, [end]]) 
#傳回S中最後出現的substr的第一個字母的标号,如果S中沒有substr則傳回-1,也就是說從右邊算起的第一次出現的substr的首字母标号 
S.rindex(substr, [start, [end]]) 
S.count(substr, [start, [end]]) #計算substr在S中出現的次數 
S.replace(oldstr, newstr, [count]) 
#把S中的oldstar替換為newstr,count為替換次數。這是替換的通用形式,還有一些函數進行特殊字元的替換 
S.strip([chars]) 
#把S中前後chars中有的字元全部去掉,可以了解為把S前後chars替換為None 
S.lstrip([chars]) 
S.rstrip([chars]) 
S.expandtabs([tabsize]) 
#把S中的tab字元替換沒空格,每個tab替換為tabsize個空格,預設是8個
 
23、字元串的分割群組合 
 
S.split([sep, [maxsplit]]) 
#以sep為分隔符,把S分成一個list。maxsplit表示分割的次數。預設的分割符為空白字元 
S.rsplit([sep, [maxsplit]]) 
S.splitlines([keepends]) 
#把S按照行分割符分為一個list,keepends是一個bool值,如果為真每行後而會保留行分割符。 
S.join(seq) #把seq代表的序列──字元串序列,用S連接配接起來
 
24、字元串的mapping,這一功能包含兩個函數
 
String.maketrans(from, to) 
#傳回一個256個字元組成的翻譯表,其中from中的字元被一一對應地轉換成to,是以from和to必須是等長的。 
S.translate(table[,deletechars]) 
# 使用上面的函數産後的翻譯表,把S進行翻譯,并把deletechars中有的字元删掉。需要注意的是,如果S為unicode字元串,那麼就不支援 deletechars參數,可以使用把某個字元翻譯為None的方式實作相同的功能。此外還可以使用codecs子產品的功能來建立更加功能強大的翻譯表。
 
25、字元串還有一對編碼和解碼的函數
 
S.encode([encoding,[errors]]) 
# 其中encoding可以有多種值,比如gb2312 gbk gb18030 bz2 zlib big5 bzse64等都支援。errors預設值為"strict",意思是UnicodeError。可能的值還有'ignore', 'replace', 'xmlcharrefreplace', 'backslashreplace' 和所有的通過codecs.register_error注冊的值。這一部分内容涉及codecs子產品,不是特明白 
S.decode([encoding,[errors]])
 
26、字元串的測試、判斷函數,這一類函數在string子產品中沒有,這些函數傳回的都是bool值
 
S.startswith(prefix[,start[,end]]) 
#是否以prefix開頭 
S.endswith(suffix[,start[,end]]) 
#以suffix結尾 
S.isalnum() 
#是否全是字母和數字,并至少有一個字元 
S.isalpha() #是否全是字母,并至少有一個字元 
S.isdigit() #是否全是數字,并至少有一個字元 
S.isspace() #是否全是空白字元,并至少有一個字元 
S.islower() #S中的字母是否全是小寫 
S.isupper() #S中的字母是否便是大寫 
S.istitle() #S是否是首字母大寫的
 
27、字元串類型轉換函數,這幾個函數隻在string子產品中有
 
string.atoi(s[,base]) 
#base預設為10,如果為0,那麼s就可以是012或0x23這種形式的字元串,如果是16那麼s就隻能是0x23或0X12這種形式的字元串 
string.atol(s[,base]) #轉成long 
string.atof(s[,base]) #轉成float
 
這裡再強調一次,字元串對象是不可改變的,也就是說在python建立一個字元串後,你不能把這個字元中的某一部分改變。任何上面的函數改變了字元串後,都會傳回一個新的字元串,原字串并沒有變。其實這也是有變通的辦法的,可以用S=list(S)這個函數把S變為由單個字元為成員的list,這樣的話就可以使用S[3]='a'的方式改變值,然後再使用S=" ".join(S)還原成字元串