python 用正则表达式筛选文本信息的实例
本文主要介绍如何对多个文本进行读取,并采用正则表达式对其中的信息进行筛选,将筛选出来的信息存写到一个新文本。
文本基础操作
打开文件:open(‘文件名',‘打开方式')>>>file=open(r'C:\Users\yuanlei\Desktop\mytxt.txt','w+').为避免报错,在文件名的引号前加个r.
文件打开方式:只读——r或rt,rb为二进制文件;打开文件前清空文件内容——w或wt;在文末写入——a+;
清空内容然后在文末写入——w+;写到文件任意位置——r+;
关闭文件:文件打开运行好后必须要关闭——文件名.close()>>>mytxt.close()
读取文件中的内容:将每行内容,包括换行符,作为一个元素存入数组——lines=file_object.readlines(),但是这样会把换行符也赋进去
去除换行符——new_lines=lines.splitlines()
os包:import os 获取文件地址——os.listdir(父文件地址)
下面附上实现摘要中说的功能的完整代码:
# coding: utf-8 #读取文本中的中英文数据并使用正则表达式将所需数据筛选入到一个新文本中 import re import os #zhengze函数对读取到的数据进行筛选,并将筛选好的数据存入数组new_lines new_lines=[] #申明new_lines数组 def zhengze(f): regex_str=".*?(l.*?e).*" for x in f: new_x = x.splitlines() #注意:splitlines是将传入的字符串去除'\n'之后以数组的形式传出,而不是字符串形式 match_obj=re.match(regex_str,new_x[0]) if match_obj: new_lines.append(match_obj.group(1)) else: new_lines.append('no') return new_lines #获取指定文件夹下的所有文本的绝对地址,并存入数组file_path path=r'C:\Users\yuanlei\Desktop\new_file_txt' file_path=[] for filename in os.listdir(path): #获取path下所有文件的路径 file_path.append((os.path.join(path,filename))) print file_path #对每个文本调用正则函数进行筛选,筛选过后的数据存入数组final for adress in file_path: file_object=open(adress) lines = file_object.readlines( ) #将文本中的内容以数组的形式(每行为一个元素)赋给lines file_object.close() final=zhengze(lines) print final #将筛选出来的数据写入新文本re_new.txt file_2=open(r'C:\Users\yuanlei\Desktop\re_new.txt','w+') for x in final: file_2.write(x) file_2.write('\n') file_2.close()
以上这篇python 用正则表达式筛选文本信息的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
- Python正则表达式学习小例子
- python正则表达式实例代码
- Python编程快速上手——正则表达式查找功能案例分析
- python 正则表达式参数替换实例详解
- python正则表达式匹配IP代码实例
- python 正则表达式贪婪模式与非贪婪模式原理、用法实例分析
- Python 正则表达式爬虫使用案例解析
- Python正则表达式实现简易计算器功能示例
- python正则表达式匹配[]中间为任意字符的实例
- python 使用正则表达式按照多个空格分割字符的实例
- Python爬虫之正则表达式基本用法实例分析
- Python3使用正则表达式爬取内涵段子示例
- python的re正则表达式实例代码
- python正则表达式及使用正则表达式的例子
- python里使用正则表达式的组嵌套实例详解
- 学会Python正则表达式,就看这20个例子(脚本之家修正版)
相关文章
pyinstaller打包python3.6和PyQt5中各种错误的解决方案汇总
pyinstaller是打包python很方便的一个套件,我们可以很轻易地使用他,下面这篇文章主要给大家介绍了关于pyinstaller打包python3.6和PyQt5中各种错误解决的相关资料,需要的朋友可以参考下2022-08-08python如何通过psutil获取服务器cpu、内存、磁盘使用率
这篇文章主要介绍了python通过psutil获取服务器cpu,内存,磁盘使用率,使用psutil,可以很方便地监控系统的运行状况,诊断问题和优化性能,需要的朋友可以参考下2023-04-04深入理解Python虚拟机中列表(list)的实现原理及源码剖析
在本篇文章当中主要给大家介绍 cpython 虚拟机当中针对列表的实现,在 Python 中,List 是一种非常常用的数据类型,可以存储任何类型的数据,并且支持各种操作,如添加、删除、查找、切片等,在本篇文章当中将深入去分析这一点是如何实现的2023-03-03Python Multinomial Naive Bayes多项贝叶斯模型实现原理介绍
这篇文章主要介绍了Python Multinomial Naive Bayes多项贝叶斯模型实现原理,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习吧2022-09-09
最新评论