天天看点

Python自学之——字符串(提升)1、字符串

1、字符串

  • 符号“+”:字符串之间的拼接:

如:

str1='good good study , day day up!'
str2="好好学习,天天向上"
print(str1+":"+str2)
           

输出:good good study , day day up! : 好好学习,天天向上

注意:字符串不允许与其它类型的数据类型进行直接的拼接。例如整数类型的数据就不能直接与字符串类型的数据直接进行拼接。但是可以运用str()函数将整数类型的数据转换为字符串类型的数据,再进行相加。如:

str1='Scott'
interage=123
print(str1+str(interage))
           
  • 计算字符串的长度:

在Python中,数字、英文、小数点、下划线和空格占一个字节;一个汉字可能占2~4个字节,当然占几个字节还取决于采用的编码。汉字在GBK/GB2312编码中占2个字节,在UTF-8/unicode编码中一般占用3~4个字节。字符串长度结算可以调用len(string)函数。

str1='人生苦短,我用Python!'
print(len(str1))
           

输出:14

这里是默认的情况下,通过len()计算的长度是不区分英文和数字、汉字的所有字符按一个字符计算。如果需要获取实际的字符串所占的字节数,即如果采用UTF-8编码,汉字占3个字节。如果采用GBK或者是GB2312时,汉字占2个字节,这时可以用encode()方法(此方法为汉字占3个字节)。

str1='人生苦短,我用Python!'
print(len(str1.encode()))
           

输出:28

采用GBK编码获取长度(占2个字节):

str1='人生苦短,我用Python!'
print(len(str1.encode('gbk')))
           

输出:21

  • 截取字符串:

字符串也属于序列(如同列表一样拥有下标),截取字符串可以通过切片的方式(string[start:end:step])

String:字符串

Start:截取的开始位置

End:截取结束的位置

Step:截取的步长

截取还可以有string[start:]/string[:start]/string[int]/string[int:int]不确定步长的情况下,默认步长是1。

如下:

str1='人生苦短,我用Python!'
print(str1[:])#从第一个字符开始截取
print(str1[1:])#从第二个字符开始截取
print(str1[:3])#从左边第三个字符开始截取
print(str1[2:4])#截取二个到第三个字符
           

输出:

人生苦短,我用Python!

生苦短,我用Python!

人生苦

苦短

注意:此时要注意下标是否溢出,否则会抛出异常。

练习:输入身份证,输出出生年月日。

str_1=input("请输入你的身份证号码:"+'\n')
if len(str_1)==18:
    print("您的出生日期是:"+str_1[6:10]+"年"+str_1[10:12],'月',str_1[12:14],'日')
else:
    print("身份证号输入错误!请从新输入!")
           

输出:

请输入你的身份证号码:

342501199920125824

您的出生日期是:1999年20 月 12 日

  • 分割合并字符串:

分割、合并可以看作是一对互逆操作。运用split(sep,maxsplit)方法进行分割(sep:指定以什么符号或者字符串进行分割,后者分割的次数,则生成的列表中元素的个数为maxsplit+1)。例如:

str_my='想 找 个  好一点的工作! 好难啊!好难啊!'
list1=str_my.split()
list2=str_my.split('!')
list2=str_my.split('!',2)
print(str(list1))
print(str(list2))
print(str(list3))
           

输出:

['想', '找', '个', '好一点的工作!', '好难啊!好难啊!']

['想 找 个  好一点的工作', ' 好难啊', '好难啊', '']

['想 找 个  好一点的工作', ' 好难啊', '好难啊!']

注意:split()方法中,如果不指定前面的分隔符号,则后面的分割数不能指定。对待空格符无论是连续几个空格,都只分割一次。例如上面的例子“个”和“好”之间有两个空格,但是只分割一次。如若分割后后面没有元素了,则以空元素代替。

  • 合并字符串:

合并字符串可以用join()方法,str_new=string.join(iterable)(str_new:为新生成的字符串,string:指定用来连接的字符,iterable:可迭代对象)。如:

list_str=['I','am','tried','!']
str_new=" ".join(list_str)
print(str_new)
           

输出:

I am tried !

注意:这里合并后第一个元素的前面是没有指定的字符或者时字符串的。所以如果有特殊的输出要求还需要在输出时,在第一个元素的前面加上指定的符号或者字符串。

  • 检索字符串:

1、检索字符串是使用count()方法,str.count(sub,start,end)(str:表示原字符串,sub:表示要检索的字符串,start:检索字符串时检索的起始位置,不指定则从头检索,end:表示检索的结束位置,不指定则表示直到检索到结尾。如果检索不到该方法返回0,如果检索到则返回个数。如:

str1='小城市没有工作啊啊啊!啊'
print(str1.count("啊",9,10))
print(str1.count("啊"))
           

输出:

1

4

2、检索字符串也可以用find()方法来实现,find()方法与count()方法内参相同,不同在于。如果检索的字符串不在,则返回-1,如果存在则返回第一次出现该字符串的位置。用此方法可以判断某字符串是否在指定的字符串内。当然用“in”也可以。(还有rfind()方法只不过相对于find()是从右边开始遍历查找的)例如:

str_new='挣钱好难啊!'
print(str_new.find("钱"))
print(str_new.find('ok'))
           

输出:

1

-1

3、查找还有index()方法与find()方法类似,唯一不同在于当查找的字符串不存在时抛出异常。同样也有rindex()方法意义同rfind()方法。此处不做示例。

4、startwith()方法内参同上面一样但是是判定是否是以某字符串开头返回true或者false。同样的还有endwith()方法

  • 字母大小写转换:

1、lower()方法:大写字母转换为小写的字母。注意如果没有符合要求的字符则会元字符输出。如果转换则原字符串和转换后的字符串长度相同。例如

str_lower='LIFE IS TOO HARD!'
print(str_lower.lower())
           

输出:life is too hard!

2、upper()方法:同lower()类似,区别在于是将小写的字符串转换为大写的字符串。print(str_lower.upper())

例如一些网站注册时填写的注册名(不区分大小写):

list2=["scott","alex","bob","dava"]
list1=input("请输入注册名:"+'\n')
if list1.lower() in list2:
    print("用户名已存在!请重新输入!")
else:
    list2.append(list1)
    print(list2)
           
  • 去除字符串中的空格和特殊字符:

在输入的时候可能有时会输入一些多余的空格和一些特殊的字符串,比喻不允许出现空格的密码输入等。这时候可以用strip()方法来去除。Str_new.strip([chars])去掉字符串左右两侧的空格和一些特殊的字符串。当然如果指定chars的参数(可以指定多个),则会去除指定的字符。如果不指定参数则会默认除去空格、制表符、回车符和换行符如:

str_new='&*明天要上班!好烦啊!@@@&'
print(str_new.strip('@&*'))
           

输出:明天要上班!好烦啊!

注意:当然还有lstrip()和rstrip()看组成顾名思义分别是针对字符串左边和右边的操作。

  • 格式化字符串:

老版中对字符串的格式化比较繁杂,’%[-][+][0][m][.n]格式化字符‘%exp(详情看我其他的CSDN博客文章)此处重点讲解format()。具体格式如下:{[index][:[[fill]align][sign][#][width][.precision][type]]}

Index:可选参数,参数列表中的索引位置从0开始,默认根据值的先后顺序自动匹配。

fill:可选参数,用于指定空白处填充的字符。

align:可选参数,需要配合width一起使用。“<”内容左对齐,“>”内容右对齐,“=”:内容右对齐,符号放在左侧,只对数字类型有效。“^”表示居中。

sign:可选参数,指定有无符号数

print('{0:d}科学计数表示法:{1:E}'.format(1200,13))
           

输出:ke1200科学计数表示法:1.300000E+01

业余爱好,欢迎交流

Python自学之——字符串(提升)1、字符串