Python读取和写入txt、Excel文件和JSON文件的方法

 更新时间:2024年07月10日 09:22:18   作者:SiYuanFeng  
Python 提供了多种方法来读取和写入不同类型的文件,包括文本文件(txt)、Excel 文件和 JSON 文件,本文给大家介绍了一些常用的方法和示例代码,对大家的学习或工作有一定的帮助,需要的朋友可以参考下

Python 提供了多种方法来读取和写入不同类型的文件,包括文本文件(txt)、Excel 文件和 JSON 文件。以下是一些常用的方法和示例代码:

读取/写入 txt 文件

基本读取txt

读取 txt 文件

  • 使用内置的 open 函数
# 读取整个文件内容
with open('example.txt', 'r', encoding='utf-8') as file:
    content = file.read()
    print(content)

# 逐行读取文件内容
with open('example.txt', 'r', encoding='utf-8') as file:
    for line in file:
        print(line.strip())

写入 txt 文件

  • 使用内置的 open 函数
# 写入文本到文件(覆盖模式)
with open('example.txt', 'w', encoding='utf-8') as file:
    file.write('Hello, World!\n')

# 追加文本到文件
with open('example.txt', 'a', encoding='utf-8') as file:
    file.write('Appending a new line.\n')

按行读取复杂数据

  • 逐行读取并处理每行数据
# 假设我们的文件内容如下:
# Name, Age, City
# Alice, 30, New York
# Bob, 25, Los Angeles

with open('example.txt', 'r', encoding='utf-8') as file:
    header = file.readline().strip().split(', ')
    data = []
    for line in file:
        values = line.strip().split(', ')
        record = dict(zip(header, values))
        data.append(record)
    print(data)

处理大txt文本文件(逐行读取以节省内存)

# 逐行读取大文件
with open('large_file.txt', 'r', encoding='utf-8') as file:
    for line in file:
        process_line(line)  # 自定义的处理函数

读取/写入 Excel 文件

基本读取

读取 Excel 文件

  • 使用 pandas 库
import pandas as pd

# 读取 Excel 文件
df = pd.read_excel('example.xlsx', sheet_name='Sheet1')
print(df)
  • 使用 openpyxl 库(适用于 .xlsx 文件)
from openpyxl import load_workbook

# 读取 Excel 文件
wb = load_workbook('example.xlsx')
sheet = wb['Sheet1']
for row in sheet.iter_rows(values_only=True):
    print(row)

写入 Excel 文件

  • 使用 pandas 库
import pandas as pd

# 创建一个 DataFrame
data = {'Name': ['Alice', 'Bob'], 'Age': [25, 30]}
df = pd.DataFrame(data)

# 写入 Excel 文件
df.to_excel('example.xlsx', sheet_name='Sheet1', index=False)
  • 使用 openpyxl 库
from openpyxl import Workbook

# 创建一个新的 Excel 文件
wb = Workbook()
sheet = wb.active
sheet.title = 'Sheet1'

# 写入数据
sheet.append(['Name', 'Age'])
sheet.append(['Alice', 25])
sheet.append(['Bob', 30])

# 保存文件
wb.save('example.xlsx')

处理复杂 Excel 文件(多个工作表)

  • 使用 pandas 读取多个工作表
import pandas as pd

# 读取 Excel 文件的所有工作表
xls = pd.ExcelFile('example.xlsx')
sheets = {}
for sheet_name in xls.sheet_names:
    sheets[sheet_name] = pd.read_excel(xls, sheet_name=sheet_name)
    print(f"Sheet: {sheet_name}")
    print(sheets[sheet_name])
  • 使用 openpyxl 逐行读取
from openpyxl import load_workbook

# 读取 Excel 文件
wb = load_workbook('example.xlsx')
for sheet_name in wb.sheetnames:
    sheet = wb[sheet_name]
    print(f"Sheet: {sheet_name}")
    for row in sheet.iter_rows(values_only=True):
        print(row)

处理大 Excel 文件(使用 pandas 的 chunksize 参数)

import pandas as pd

# 逐块读取大 Excel 文件
chunk_size = 1000
for chunk in pd.read_excel('large_file.xlsx', sheet_name='Sheet1', chunksize=chunk_size):
    process_chunk(chunk)  # 自定义的处理函数

读取/写入 JSON 文件

基本读取

基本读取 JSON 文件

  • 使用内置的 json 模块
import json

# 读取 JSON 文件
with open('example.json', 'r', encoding='utf-8') as file:
    data = json.load(file)
    print(data)

写入 JSON 文件

  • 使用内置的 json 模块
import json

# 数据
data = {'name': 'Alice', 'age': 25}

# 写入 JSON 文件
with open('example.json', 'w', encoding='utf-8') as file:
    json.dump(data, file, ensure_ascii=False, indent=4)

读取嵌套数据:

读取嵌套json文件:

  • 读取嵌套 JSON 数据
import json

# 假设我们的 JSON 文件内容如下:
# {
#     "name": "Alice",
#     "age": 30,
#     "address": {
#         "city": "New York",
#         "zipcode": "10001"
#     },
#     "phones": ["123-456-7890", "987-654-3210"]
# }

with open('example.json', 'r', encoding='utf-8') as file:
    data = json.load(file)
    print(data)

# 访问嵌套数据
print(data['address']['city'])  # 输出: New York
print(data['phones'][0])  # 输出: 123-456-7890

写入嵌套 JSON 数据

import json

# 嵌套数据
data = {
    "name": "Alice",
    "age": 30,
    "address": {
        "city": "New York",
        "zipcode": "10001"
    },
    "phones": ["123-456-7890", "987-654-3210"]
}

# 写入 JSON 文件
with open('example.json', 'w', encoding='utf-8') as file:
    json.dump(data, file, ensure_ascii=False, indent=4)

复杂读取json文件

按行读取 JSON 文件在处理大文件或流式处理数据时非常有用。以下是一些方法来按行读取 JSON 文件:

方法一:逐行读取并解析每行 JSON

如果 JSON 文件每行都是一个独立的 JSON 对象,可以逐行读取并解析每行:

import json

# 假设我们的 JSON 文件内容如下,每行是一个独立的 JSON 对象:
# {"name": "Alice", "age": 30}
# {"name": "Bob", "age": 25}

with open('example.json', 'r', encoding='utf-8') as file:
    for line in file:
        data = json.loads(line.strip())
        print(data)

方法二:逐行读取并解析嵌套 JSON

如果 JSON 文件是一个包含多个对象的数组,可以使用 ijson 库逐行解析嵌套 JSON 数据:

import ijson

# 假设我们的 JSON 文件内容如下:
# [
#     {"name": "Alice", "age": 30},
#     {"name": "Bob", "age": 25}
# ]

with open('example.json', 'r', encoding='utf-8') as file:
    parser = ijson.parse(file)
    for prefix, event, value in parser:
        if prefix.endswith('.name') and event == 'string':
            print(f"Name: {value}")
        elif prefix.endswith('.age') and event == 'number':
            print(f"Age: {value}")

方法三:处理大 JSON 文件(分块读取)

对于非常大的 JSON 文件,可以考虑分块读取和处理:

import json

def process_chunk(chunk):
    for line in chunk:
        data = json.loads(line.strip())
        print(data)

chunk_size = 1000  # 每次读取1000行

with open('large_file.json', 'r', encoding='utf-8') as file:
    chunk = []
    for line in file:
        chunk.append(line)
        if len(chunk) >= chunk_size:
            process_chunk(chunk)
            chunk = []
    if chunk:
        process_chunk(chunk)

方法四:使用 jsonlines 库

jsonlines 库专门用于处理每行一个 JSON 对象的文件:

import jsonlines

# 假设我们的 JSON 文件内容如下,每行是一个独立的 JSON 对象:
# {"name": "Alice", "age": 30}
# {"name": "Bob", "age": 25}

with jsonlines.open('example.json') as reader:
    for obj in reader:
        print(obj)

这些方法可以帮助你按行读取 JSON 文件,根据文件的具体结构和大小选择合适的方法来处理数据。
以上是一些常见的方法来读取和写入 txt、Excel 和 JSON 文件。每种方法都有其优缺点,选择哪种方法取决于具体的需求和使用场景。

以上就是Python读取和写入txt、Excel文件和JSON文件的方法的详细内容,更多关于Python读取和写入txt、Excel和JSON的资料请关注脚本之家其它相关文章!

相关文章

  • Python中串口通信库pyserial基础知识

    Python中串口通信库pyserial基础知识

    Python的pyserial库是一个用于通过串口进行通信的库,下面这篇文章主要给大家介绍了关于Python中串口通信库pyserial基础知识的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参考下
    2024-08-08
  • tensorflow实现在函数中用tf.Print输出中间值

    tensorflow实现在函数中用tf.Print输出中间值

    今天小编就为大家分享一篇tensorflow实现在函数中用tf.Print输出中间值,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-01-01
  • pytest利用request fixture实现个性化测试需求详解

    pytest利用request fixture实现个性化测试需求详解

    这篇文章主要为大家详细介绍了pytest如何利用request fixture实现个性化测试需求,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起了解一下
    2023-09-09
  • python去除空格,tab制表符和\n换行符的小技巧分享

    python去除空格,tab制表符和\n换行符的小技巧分享

    这篇文章主要介绍了python去除空格,tab制表符和\n换行符的小技巧,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-01-01
  • Python直接赋值、浅拷贝与深度拷贝实例分析

    Python直接赋值、浅拷贝与深度拷贝实例分析

    这篇文章主要介绍了Python直接赋值、浅拷贝与深度拷贝,结合实例形式分析了Python直接赋值、浅拷贝与深度拷贝的概念、原理、用法及相关操作注意事项,需要的朋友可以参考下
    2019-06-06
  • matplotlib之属性组合包(cycler)的使用

    matplotlib之属性组合包(cycler)的使用

    这篇文章主要介绍了matplotlib之属性组合包(cycler)的使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-02-02
  • Python中如何检查字符串是否包含列表中的元素

    Python中如何检查字符串是否包含列表中的元素

    在数据预处理或纠错的过程中可能会用到对列表中是否含有我们需要的字符串的判断,下面这篇文章主要给大家介绍了关于Python中如何检查字符串是否包含列表中的元素的相关资料,需要的朋友可以参考下
    2023-06-06
  • 对Python3中bytes和HexStr之间的转换详解

    对Python3中bytes和HexStr之间的转换详解

    今天小编就为大家分享一篇对Python3中bytes和HexStr之间的转换详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-12-12
  • 利用python实现简单的循环购物车功能示例代码

    利用python实现简单的循环购物车功能示例代码

    购物车对我们每位开发者来说应该都不陌生,下面这篇文章主要给大家介绍了利用python实现简单的循环购物车功能的相关资料,文中给出了详细的示例代码供大家参考学习,需要的朋友们下面来一起看看吧。
    2017-07-07
  • python中文分词教程之前向最大正向匹配算法详解

    python中文分词教程之前向最大正向匹配算法详解

    中文分词是中文文本处理的一个基础性工作,然而长久以来,在Python编程领域,一直缺少高准确率、高效率的分词组件。下面这篇文章主要给大家介绍了关于python中文分词教程之前向最大正向匹配算法的相关资料,需要的朋友可以参考下。
    2017-11-11

最新评论