Python实现提取JSON数据中的键值对并保存为.csv文件

 更新时间:2023年09月17日 09:49:18   作者:疯狂学习GIS  
这篇文章主要为大家详细介绍了如何基于Python实现读取JSON文件数据,并将JSON文件中指定的键值对数据转换为.csv格式文件,感兴趣的小伙伴可以了解下

在之前的文章Python提取JSON文件中的指定数据并保存在CSV或Excel表格文件内中,我们就介绍过将JSON文件数据保存到.csv格式或.xlsx格式的表格文件中的方法;而本文我们将针对不同的待提取数据特征,给出另一种方法。

首先,我们来明确一下具体的需求。我们现有一个JSON文件数据,是一个包含多个JSON对象的列表,如下图所示;其中,我们希望将text中的内容提取出来——text中的数据都是以键值对的形式存储的,我们希望的是,将键值对的键作为.csv格式文件的列名,而值则是这一列对应的值;因为这个JSON数据中包含很多个text(每一个text中的所有键都是一样的,但是值不完全一致),所以我们最后就会得到一个具有很多行的.csv格式文件。

明确了需求,我们就可以开始代码的撰写。本文所用代码如下。

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
Created on Fri Sep 15 11:12:01 2023
@author: fkxxgis
"""
import json
import csv
json_file = "/Users/ddd/Downloads/single.json"
with open(json_file, 'r') as file:
    data = json.load(file)
fieldnames = set()
for item in data:
    fieldnames.update(json.loads(item['text']).keys())
csv_filename = "/Users/didi/Downloads/output.csv"
with open(csv_filename, 'w', newline='') as csvfile:
    writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
    writer.writeheader()
    for item in data:
        json_string = item['text']
        row_data = json.loads(json_string)
        writer.writerow(row_data)

其中,我们首先通过import语句导入必要的Python模块,包括用于处理JSON数据的json和用于处理CSV文件的csv。

接下来,我们打开名为single.json的JSON文件并读取其内容,将其存储在data变量中。json.load(file)用于将JSON文件内容加载到Python数据结构中。随后,创建一个空集合fieldnames,用于存储将在CSV文件的头部写入的列名。

紧接着,我们遍历data列表中的每个元素,其中每个元素是一个包含JSON格式的字符串的字典。对于每个元素,将JSON文本——也就是item['text']解析为字典,并获取该字典中的所有键。这些键将被添加到fieldnames集合中,以便稍后在CSV文件的头部(列名称)使用。

其次,创建一个CSV文件output.csv以进行写入,使用csv.DictWriter对象初始化,其中指定了要写入的列名(通过fieldnames变量)。使用writer.writeheader()写入CSV文件的头部,这将包含字段名称。最后,遍历data列表中的每个元素,对于每个元素,将JSON文本解析为字典,并将该字典的数据写入CSV文件中,每行对应一个JSON对象。

执行上述代码,我们即可在指定的结果.csv格式文件中看到我们转换之后的数据结果;如下图所示。其中,紫色框内部分就是列名,也就是我们提取出来的键,而值则是每一行的数据。

至此,大功告成。

到此这篇关于Python实现提取JSON数据中的键值对并保存为.csv文件的文章就介绍到这了,更多相关Python提取json数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python爬取成语接龙类网站

    Python爬取成语接龙类网站

    在本篇文章里我们给大家分享了关于Python爬取成语接龙类网站的相关知识点,有需要的朋友们学习下。
    2018-10-10
  • Python 并行化执行详细解析

    Python 并行化执行详细解析

    这篇文章主要介绍了Python 并行化执行详细解析,文章围绕主题展开详细的内容介绍,具有一定的参考价值,需要的小伙伴可以参考一下,希望对你的学习有所帮助
    2022-07-07
  • python实现向ppt文件里插入新幻灯片页面的方法

    python实现向ppt文件里插入新幻灯片页面的方法

    这篇文章主要介绍了python实现向ppt文件里插入新幻灯片页面的方法,涉及Python操作ppt文档添加幻灯片的相关技巧,非常具有实用价值,需要的朋友可以参考下
    2015-04-04
  • Django零基础入门之静态文件的引用

    Django零基础入门之静态文件的引用

    这篇文章主要介绍了Django零基础入门之静态文件的引用,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-09-09
  • 解决Pycharm界面的子窗口不见了的问题

    解决Pycharm界面的子窗口不见了的问题

    今天小编就为大家分享一篇解决Pycharm界面的子窗口不见了的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-01-01
  • 深入理解Django的中间件middleware

    深入理解Django的中间件middleware

    这篇文章主要给大家介绍了关于Django中的中间件middleware的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧。
    2018-03-03
  • python连接PostgreSQL数据库的过程详解

    python连接PostgreSQL数据库的过程详解

    这篇文章主要介绍了python连接PostgreSQL数据库的过程详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-09-09
  • Python中print()函数的用法详情

    Python中print()函数的用法详情

    这篇文章主要介绍了Python中print()函数的用法详情,Python中print()函数的方法是打印指定的内容。在交互环境中输入“help(print)”指令,可以显示print()函数的使用方法,下面来看看具体的详细内容吧
    2022-02-02
  • django+xadmin+djcelery实现后台管理定时任务

    django+xadmin+djcelery实现后台管理定时任务

    这篇文章主要介绍了django+xadmin+djcelery实现后台管理定时任务,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-08-08
  • 一文详解Python加解压文件gzip库的操作

    一文详解Python加解压文件gzip库的操作

    Gzip是若干种文件压缩程序的简称,通常指GNU计划的实现。本文为大家介绍了Python中加解压文件gzip库的基本操作,感兴趣的小伙伴可以了解一下
    2022-11-11

最新评论