解决python将xml格式文件转换成txt文件的问题(xml.etree方法)

 更新时间:2021年09月19日 11:02:19   作者:小k同学!  
从数据分析的角度去看xml格式的数据集,具有简单性,结构和内容分离、可扩展性的特征,今天通过本文给大家分享python将xml格式文件转换成txt文件的问题及解决方法(xml.etree方法),感兴趣的朋友一起看看吧

概述

先来介绍一下xml格式的文件,从数据分析的角度去看xml格式的数据集,具有以下的优点开放性(能在任何平台上读取和处理数据,允许通过一些网络协议交换xml数据)、简单性(纯文本,能在不同的系统之间交换数据)、结构和内容分离(不同于HTML,数据的显示和数据本身是分开的)、可扩展性(派生出其他标记语言)

问题描述

那么我们在进行数据分析的时候,如何运用xml里面的数据呢?
我们就需要将这类文件转化成其他类型的文件。
(其实我认为说成提取xml的数据组成新的类型文件比较好一点)
就我个人的观点,处理这方面的问题有点类似于网络爬虫,但不同于爬虫的是不需要考虑IP代理地址的问题(反爬确实是一个很难处理的问题)

问题解决方案

xml格式文件显示内容大致如下:

在这里插入图片描述

import os
import sys
import xml.etree.ElementTree as ET
import glob

def xml_to_txt(indir, outdir):
    os.chdir(indir) # indir为xml文件来源的文件夹,outdir为转换的txt文件存储路径
    annotated = os.listdir('.') # 返回包含目录中文件名称的列表
    print(annotated)
    
    for i, file in enumerate(annotated):
        file_save = file.split('.')[0] + '.txt' #split将文件名与后缀名划分开来
        file_txt = outdir + "\\"+file_save
        f_w = open(file_txt, 'w')
        
        in_file = open(file,encoding='UTF-8')
        tree = ET.parse(in_file)
        root = tree.getroot()
        # 以下代码可忽略,你要在xml数据集上找到自己所需要数据对应的标签,想办法将其赋予一个变量,再将其写入新文件里就ok了
        for value in root.iter('xxx'):
            value = value.text
            f_w.write(value)
            f_w.write('\n\n')

还有我要说几句这个方法还是挺好用的,在你处理一个包含很多.xml文件夹的时候,能够直接读取所有xml文件,这样处理起来也比较方便。

到此这篇关于python将xml格式文件转换成txt文件的问题及解决方法(xml.etree方法)的文章就介绍到这了,更多相关python xml转换成txt文件内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • tensorflow如何批量读取图片

    tensorflow如何批量读取图片

    这篇文章主要为大家详细介绍了tensorflow如何批量读取图片,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-08-08
  • Python3交互式shell ipython3安装及使用详解

    Python3交互式shell ipython3安装及使用详解

    这篇文章主要介绍了Python3交互式shell ipython3安装及使用详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-07-07
  • 如何安装2019Pycharm最新版本(详细教程)

    如何安装2019Pycharm最新版本(详细教程)

    这篇文章主要介绍了如何安装2019Pycharm最新版本(详细教程),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-09-09
  • 利用Pycharm + Django搭建一个简单Python Web项目的步骤

    利用Pycharm + Django搭建一个简单Python Web项目的步骤

    这篇文章主要介绍了利用Pycharm + Django搭建一个简单Python Web项目的步骤,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-10-10
  • Python 文本文件与csv文件的读取与写入

    Python 文本文件与csv文件的读取与写入

    这篇文章主要介绍了Python文本文件与csv文件的读取与写入,有读取文件的 read()方法、读取文件的readline() 方法、读取文件的 readlines()方法等相关读写内容,需要的小伙伴可以参考一下
    2022-03-03
  • 使用python如何实现泛型函数

    使用python如何实现泛型函数

    这篇文章主要介绍了使用python如何实现泛型函数,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-09-09
  • Python使用Pandas读写Excel实例解析

    Python使用Pandas读写Excel实例解析

    这篇文章主要介绍了Python使用Pandas读写Excel实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-11-11
  • Python 3中print函数的使用方法总结

    Python 3中print函数的使用方法总结

    这篇文章主要给大家总结介绍了关于Python 3中print函数的使用方法,python3中的print函数和之前版本的用法相差很多,本文通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面来一起看看吧。
    2017-08-08
  • 浅谈Python批处理文件夹中的txt文件

    浅谈Python批处理文件夹中的txt文件

    这篇文章主要介绍了Python批处理文件夹中的txt文件,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-03-03
  • python获取word文档总页数的两种方法

    python获取word文档总页数的两种方法

    这篇文章主要介绍了python获取word文档的总页数的两种方法,文中给出了两种解决方案,两种方案也都各有优缺点,可能也不一定是完全准确的,需要的朋友可以参考下
    2024-03-03

最新评论