简单了解Python读取大文件代码实例

 更新时间:2019年12月18日 11:24:27   作者:沉默的赌徒  
这篇文章主要介绍了简单了解Python读取大文件代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

这篇文章主要介绍了简单了解Python读取大文件代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

通常对于大文件读取及处理,不可能直接加载到内存中,因此进行分批次小量读取及处理

I、第一种读取方式

一行一行的读取,速度较慢

def read_line(path):
  with open(path, 'r', encoding='utf-8') as fout:
    line = fout.readline()
    while line:
      line = fout.readline()
      print(line)

II、第二种读取方式

设置每次读取大小,从而完成多行快速读取

def read_size(path):
  with open(path, "r", encoding='utf-8') as fout:
    while 1:
      buffer = fout.read(8 * 1024 * 1024)
      if not buffer:
        break
      print(buffer)

III、第三种读取方式

使用itertools模块,islice返回的是一个生成器,可以用list格式化

from itertools import islice
def read_itertools(path):
  with open(path, 'r', encoding='utf-8') as fout:
    list_gen = islice(fout, 0, 5) # 两个参数分别表示开始行和结束行
    for line in list_gen:
      print(line)

完成

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • Pytorch环境搭建与基本语法

    Pytorch环境搭建与基本语法

    这篇文章主要介绍了Pytorch环境搭建与基本语法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-06-06
  • python实现自动获取IP并发送到邮箱

    python实现自动获取IP并发送到邮箱

    这篇文章主要为大家详细介绍了python实现自动获取IP并发到邮箱,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-12-12
  • Python Opencv实现图像轮廓识别功能

    Python Opencv实现图像轮廓识别功能

    这篇文章主要为大家详细介绍了Python Opencv实现图像轮廓识别功能,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-04-04
  • Ubuntu下Anaconda和Pycharm配置方法详解

    Ubuntu下Anaconda和Pycharm配置方法详解

    这篇文章主要为大家详细介绍了Ubuntu下Anaconda和Pycharm配置方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-06-06
  • tkinter如何实现打开文件对话框并获取文件绝对路径

    tkinter如何实现打开文件对话框并获取文件绝对路径

    这篇文章主要介绍了tkinter实现打开文件对话框并获取文件绝对路径问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-01-01
  • python中元组的用法整理

    python中元组的用法整理

    在本篇内容里小编给大家整理的是关于python中元组的用法及相关实例,需要的朋友们可以学习下。
    2020-06-06
  • python解决No module named pip问题两种方法

    python解决No module named pip问题两种方法

    当出现No module named pip错误时,表明您的Python环境缺少pip模块,下面这篇文章主要给大家介绍了关于python解决No module named pip问题的两种方法,需要的朋友可以参考下
    2024-01-01
  • pyspark连接mysql数据库报错的解决

    pyspark连接mysql数据库报错的解决

    本文主要介绍了pyspark连接mysql数据库报错的解决,因为spark中缺少连接MySQL的驱动程序,下面就来介绍一下解决方法,感兴趣的可以了解一下
    2023-11-11
  • python字符串中匹配数字的正则表达式

    python字符串中匹配数字的正则表达式

    正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。这篇文章主要介绍了python字符串中匹配数字的正则表达式 ,需要的朋友可以参考下
    2019-07-07
  • 详解Python遍历列表时删除元素的正确做法

    详解Python遍历列表时删除元素的正确做法

    这篇文章主要介绍了详解Python遍历列表时删除元素的正确做法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-01-01

最新评论