教你用python提取txt文件中的特定信息并写入Excel

 更新时间:2021年11月28日 15:17:45   作者:Wo看见常威在打来福  
这篇文章主要给大家介绍了如何利用python提取txt文件中的特定信息并写入Excel的相关资料,Python是一个强大的语言,解决这点问题非常简单,文中通过示例代码介绍的非常详细,需要的朋友可以参考下

问题描述:

我有一个这样的数据集叫test_result_test.txt,大概几百上千行,两行数据之间隔一个空行。

N:505904X:0.969wsecY:0.694wsec

N:506038X:4.246wsecY:0.884wsec

N:450997X:8.472wsecY:0.615wsec

...

现在我希望能提取每一行X:和Y:后面的数字,然后保存进Excel做进一步的数据处理和分析

就拿第一行来说,我只需要0.969 和0.694。每一行三个数字的具体位置是不确定的,因此不能用固定的列数去处理,刚好发现split函数能对文本进行切片,所以这里我们用这个函数来提取需要的数字信息。

split函数语法如下:

1、split()函数

语法:str.split(str="",num=string.count(str))[n]

参数说明:

str:表示为分隔符,默认为空格,但是不能为空('')。若字符串中没有分隔符,则把整个字符串作为列表的一个元素

num:表示分割次数。如果存在参数num,则仅分隔成 num+1 个子字符串,并且每一个子字符串可以赋给新的变量

[n]:表示选取第n个分片

注意:当使用空格作为分隔符时,对于中间为空的项会自动忽略

于是对于我们这里的文本,我们可以先用“:”切片,把文本分成三份,比如对于第一行

以“:”进行切片得到

取第三个分片进行“w”切片,得到

这里的第一分片就是我们要的X坐标

最后我们分析一下思路:

首先定位文件位置读取txt文件内容,去掉空行保存Excel准备工作,新建Excel表格,并编辑好标题为写入数据就位对于每一行数据,首先用‘:'进行切片,再用‘w'切片得到想要的数字,然后写入Excel保存

工具:

安装好python模块的visual studio 2017

包:os,xlwt

操作:

先import我们所需要的包

import os
import xlwt

1.找到我们想要处理的文件,因此去到指定的位置,定位好文件

a = os.getcwd() #获取当前目录
print (a) #打印当前目录
os.chdir('D:/') #定位到新的目录,请根据你自己文件的位置做相应的修改
a = os.getcwd() #获取定位之后的目录
print(a) #打印定位之后的目录

2.打开我们的txt文件查看下里面的内容(这一步可有可无)

#读取目标txt文件里的内容,并且打印出来显示
with open('test_result1.txt','r') as raw:
	for line in raw:
		print (line)

3.去除空白行并保存

#去掉txt里面的空白行,并保存到新的文件中
with open('test_result1.txt','r',encoding = 'utf-8') as fr, open('output.txt','w',encoding= 'utf-8') as fd:
	for text in fr.readlines():
		if text.split():
			fd.write(text)
	print('success')

执行完毕同个位置下多了一个txt文件

4. 创建一个Excel文件

#创建一个workbook对象,相当于创建一个Excel文件
book = xlwt.Workbook(encoding='utf-8',style_compression=0)
'''
Workbook类初始化时有encoding和style_compression参数
encoding:设置字符编码,一般要这样设置:w = Workbook(encoding='utf-8'),就可以在excel中输出中文了。默认是ascii。
style_compression:表示是否压缩,不常用。
'''

5.创建一个sheet对象

# 创建一个sheet对象,一个sheet对象对应Excel文件中的一张表格。
sheet = book.add_sheet('Output', cell_overwrite_ok=True)
# 其中的Output是这张表的名字,cell_overwrite_ok,表示是否可以覆盖单元格,其实是Worksheet实例化的一个参数,默认值是False

6.在表格里添加好基本的数据标题,我这里是X和Y坐标

# 向表中添加数据标题
sheet.write(0, 0, 'X')  # 其中的'0-行, 0-列'指定表中的单元,'X'是向该单元写入的内容
sheet.write(0, 1, 'Y')

7.多次切割数据并定位好需要的部分保存进Excel

#对文本内容进行多次切片得到想要的部分
n=1
with open('output.txt','r+') as fd:
	for text in fd.readlines():
		x=text.split(':')[2]
		y=text.split(':')[3]
		print (x.split('w'))
		print (y.split('w'))
		sheet.write(n,0,x.split('w')[0])#往表格里写入X坐标 
		sheet.write(n,1,y.split('w')[0])#往表格里写入Y坐标
		n = n+1
# 最后,将以上操作保存到指定的Excel文件中
book.save('Output.xls')  

现在定位到之前定义的文件位置,发现又多了一个Excel表格,打开Excel,想要的数据齐齐整整的排好躺在里面,舒服~

此时数据为文本格式,想要进一步的处理请用Excel转换成数字格式

源代码:

https://github.com/julis-wolala/TextdataHandler

Reference:

https://www.jb51.net/article/230557.htm

总结

到此这篇关于教你用python提取txt文件中的特定信息并写入Excel的文章就介绍到这了,更多相关python提取txt文件写入Excel内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:

相关文章

  • 如何使用pytorch实现LocallyConnected1D

    如何使用pytorch实现LocallyConnected1D

    由于LocallyConnected1D是Keras中的函数,为了用pytorch实现LocallyConnected1D并在960×33的数据集上进行训练和验证,本文分步骤给大家介绍如何使用pytorch实现LocallyConnected1D,感兴趣的朋友一起看看吧
    2023-09-09
  • python 实现循环定义、赋值多个变量的操作

    python 实现循环定义、赋值多个变量的操作

    这篇文章主要介绍了python 实现循环定义、赋值多个变量的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-03-03
  • python打印带时间的日志实现代码

    python打印带时间的日志实现代码

    python的logging模块提供了标准的日志接口,可以通过它存储各种格式的日志,下面这篇文章主要给大家介绍了关于python打印带时间的日志的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参考下
    2024-04-04
  • python表格存取的方法

    python表格存取的方法

    这篇文章主要为大家详细介绍了python表格存取的方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-03-03
  • python实现创建新列表和新字典,并使元素及键值对全部变成小写

    python实现创建新列表和新字典,并使元素及键值对全部变成小写

    今天小编就为大家分享一篇python实现创建新列表和新字典,并使元素及键值对全部变成小写,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-01-01
  • python队列Queue的详解

    python队列Queue的详解

    这篇文章主要介绍了python队列Queue,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-05-05
  • 记录一下scrapy中settings的一些配置小结

    记录一下scrapy中settings的一些配置小结

    这篇文章主要介绍了记录一下scrapy中settings的一些配置小结,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-09-09
  •  分享4款Python 自动数据分析神器

     分享4款Python 自动数据分析神器

    这篇文章主要给大家分享的是4款Python 自动数据分析神器,我给大家分享 4 款常用的EDA工具,它们可以自动产出统计数据和图表,为我们节省大量时间,需要的朋友可以参考一下
    2022-03-03
  • 使用Pandas和Matplotlib进行数据清洗与可视化的实现步骤

    使用Pandas和Matplotlib进行数据清洗与可视化的实现步骤

    在数据科学领域,数据清洗和可视化是构建数据驱动解决方案的重要步骤,本文将详细介绍如何使用Pandas进行数据清洗,并结合Matplotlib进行可视化,文章通过实际代码示例讲解的非常详细,需要的朋友可以参考下
    2024-08-08
  • pytorch使用voc分割数据集训练FCN流程讲解

    pytorch使用voc分割数据集训练FCN流程讲解

    这篇文章主要介绍了pytorch使用voc分割数据集训练FCN流程,图像分割发展过程也经历了传统算法到深度学习算法的转变,传统的分割算法包括阈值分割、分水岭、边缘检测等等
    2022-12-12

最新评论