使用Python去除字符串中某个字符的多种实现方式比较
1、如何去掉字符串中不需要的字符?
实际案例:
(1)过滤掉用户输入前后多余的空白字符:' nick2008@gmail.com '
(2)过滤某windows下编辑文本中的'\r':'hello world\r\n'
(3)去掉文本中的unicode组合符号(调音):u'ní hǎo, chī fàn'(或 èěéēàǎā)
解决方案;
方法1:字符串strip(),lstrip(),rstrip()方法去掉字符串两端字符。
方法2:删除单个固定位置的字符,可以使用切片+拼接的方式。
方法3:字符串的replace()替换方法或正则表达式re.sub()删除任意位置字符。(通用)
方法4:字符串translate()方法,可以同时删除多种不同字符。
2、代码演示
# 方法1:strip类的方法 # 去掉字符串两端的字符 s = ' abc 123 ' ''' str.strip方法介绍: strip([chars]) -> string or unicode chars不指定默认情况下去掉空白字符(空格,\n,\t,\r) ''' # 去掉两端空白,但保留了中间的空白 print(s.strip()) # 只去掉左端的空白 print(s.lstrip()) # 只去掉右端的空白 print(s.rstrip()) s2 = '---abc+++' # 去掉s2中的加减 print(s2.strip('-+')) # 方法2:删除固定位置字符,切片+拼接 s3 = 'abc:123' # 只删除固定位置的冒号 s4 = s3[0:3] + s3[4:] print(s4) # 方法3: ''' 因为第1种方法不能删除中间的某些字符,只能在两端进行删除, 第3种就能完成删除中间某些字符的事情。 ''' s5 = '\tabc\t123\txyz' # 清除s5中的所有\t,可以使用字符串替换replace, # 但是这种方式只能替换一种 print(s5.replace('\t', '')) s6 = '\tabc\t123\txyz\ropq\r' import re # 去除s6中的\t和\r print(re.sub('[\t\r]', '', s6)) # 方法4: ''' str.translate方法介绍: S.translate(table) -> string table如果是None不做任何映射,如果存在就是一个字符映射到另一个字符上去的表; ''' s7 = 'abc1230323xyz' # 现在对s7字符串进行加密,加密规则是将其中a全部替换成x, # b替换成y,c替换成z,反过来将其中的xyz分别替换成abc # 构建映射表 make = str.maketrans('abcxyz', 'xyzabc') print(make) # 对s7字符串进行加密转换 print(s7.translate(make)) s8 = 'abc\refg\n2342\t' # 删除s8中\r,\n,\t,构建映射表str_trans str_trans = str.maketrans('', '', '\t\r\n') print(s8.translate(str_trans)) # 去掉音标符号 u = u'nǐ hǎo, chī fàn' import unicodedata, sys # 将原始输入标准化为分解形式字符 a = unicodedata.normalize('NFD', u) ''' 使用dict.fromkeys() 方法构造一个字典,每个Unicode和音调作为键,对应的值全部为None sys.maxunicode : 给出最大Unicode代码点的值的整数,即1114111(十六进制的0x10FFFF)。 unicodedata.combining:将分配给字符chr的规范组合类作为整数返回。如果未定义组合类,则返回0 这样我们就成功将所有组合类的值全部设置为None ''' cmb_chrs = dict.fromkeys(c for c in range(sys.maxunicode) if unicodedata.combining(chr(c))) # 调用translate函数删除所有音调 print(a.translate(cmb_chrs))
总结
到此这篇关于使用Python去除字符串中某个字符的多种实现方式比较的文章就介绍到这了,更多相关Python去除字符串中字符内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
相关文章
Python中Pandas库提供的函数pd.DataFrame的基本用法
pandas库中的pd.DataFrame()函数用于创建一个DataFrame对象,它是一个二维表格数据结构,每列可以是不同的数据类型(数值、字符串、布尔值等),下面这篇文章主要给大家介绍了关于Python中Pandas库提供的函数pd.DataFrame的基本用法,需要的朋友可以参考下2024-03-03python详解如何通过sshtunnel pymssql实现远程连接数据库
为了安全起见,很多公司服务器数据库的访问多半是要做限制的,由专门的DBA管理,而且都是做的集群,数据库只能内网访问,所以就有一个直接的问题是,往往多数时候,在别的机器上(比如自己本地),是不能访问数据库的,给日常开发调试造成了很大不便2021-10-10python opencv鼠标画点之cv2.drawMarker()函数
这篇文章主要给大家介绍了关于python opencv鼠标画点之cv2.drawMarker()函数的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用opencv具有一定的参考下学习价值,需要的朋友可以参考下2021-10-10Python基于list的append和pop方法实现堆栈与队列功能示例
这篇文章主要介绍了Python基于list的append和pop方法实现堆栈与队列功能,结合实例形式分析了Python使用list定义及使用队列的相关操作技巧,需要的朋友可以参考下2017-07-07
最新评论