深入解读Python如何进行文件读写

 更新时间:2021年10月25日 09:27:04   作者:微小冷  
文件的作用 就是把一些存储存放起来,可以让程序下一次执行的时候直接使用,而不必重新制作一份,省时省力,本文将带你了解通过python如何进行文件的读写操作

open

Python提供了非常方便的文件读写功能,其中open是读写文件的第一步,通过open读写文件的方式和把大象装冰箱是一样的

f = open("test.txt",'w')    #第一步,把冰箱门(文件)打开
f.write("this is content")  #第二步,把大象(文件内容)装进去
f.close()                   #第三步,把冰箱门关上,否则大象可能会跑掉

open的定义方式为

file=open(path,mode='r',buffering=-1,encoding=None)

其中,

  • path为文件路径
  • mode为读取模式,默认为r,即只读模式。
  • buffering为缓冲区,由于内存的读写速度快于外设,所以大部分情况不用设,即不大于0。
  • encoding为编码方式
  • 最后,输出的file是一个文件对象。

其中,mode包括以下几种

r r+ w w+ a a+
b rb rb+ wb wb+ ab ab+

其中,b表示二进制,r表示读,w表示写,a表示追加。无论什么模式,有+则意味着可读可写。写入一般会覆盖原文件,追加则在原文件尾部开始写。如果文件不存在,w, w+, a, a+, wb会创建新文件。

文件对象

通过open创建的文件对象,除了用于关闭文件的close之外,有两组最常用的函数,即代表读写的readwrite,分别用于读写,其区别如下

read write 读写整个文件
read(size)可读取size大小的文件
readline 每次读一行
由于write直接输入字符串,故不必设置writeline
readlines writelines 前者按行读取文件,并存入一个字符串列表
writelines将一个字符串列表的形式写入文件

例如

>>> f = open('test.txt','w')
>>> f.writelines(['a','b','c\n','d'])
>>> f.close()
>>> f = open('test.txt','r')
>>> f.readlines()
['abc\n', 'd']      #在写lines的时候,并不会自动添加\n
>>> f.close()

根据我电脑的性能,读取500M的txt就要超过1s,读取2G的文件多半要报错。这个时候需要通过seek函数来指定偏移量,然后在偏移处的位置对文件进行读写操作。其输入为f.seek(offset,whence=0)

其中

  • offset为偏移量
  • whence为偏移方式,为0时表示绝对定位;为1时表示相对定位;为2表示从末尾定位。

seek的视角来看,open文件时,如果用了w,则代表seek(0),如果用了a,则代表seek(0,2)

通过tell可以返回当前偏移量,相当于seek的对偶函数。

在对文件操作结束后,需要使用f.close()将缓存中的字符串写入硬盘;如果害怕发生意外,可以用f.flush()强制写入。

此外,文件对象的成员变量如下

name mode encoding error closed buffer
文件名 读写模式 编码方式 错误模式 是否已经关闭 缓冲区

此外还有三个判定函数

readable() writable() seekable
是否可读 是否可写 可否指定偏移量

with … as表达式

在写入文件时,如果忘了close或者flush,那么可能还有一些数据留在内存中,从而导致我们得到的文件是残缺的。

with as表达式可以通过调用对象中的__enter__方法和__exit__方法,来更加智能地调用close,从而免除了忘写close的麻烦。其调用方法为

with open('text.txt','w') as f:
    f.write("12345")

查看file.py,其__exit__函数正是close:

def __enter__(self):
    return self

def __exit__(self, type, value, traceback):
    self.close()

底层实现:os.open

open是非常方便的函数,但开销也很大,毕竟直接返回了一个文件对象。相比之下,其底层实现os.open返回的是一个整型的文件ID,对于在速度上有要求的频繁的文件读写操作,可以考虑使用。

os中,打开一个文件的方法为

fd = os.open(path, flags, mode=511, dir_fd=None)

其中,

  • path为文件路径
  • flags为打开标志,例如os.O_RDONLY代表只读、os.O_WRONLY代表只写
  • mode表示文件权限,例如777代表任何人可读可写可执行;511代表文件创建者可读可执行,其他人只可读,这属于Linux的内容,日后可专门在Linux里说。
  • dir_fd表示相对路径的规则,为自定义函数,比较少用。
  • 最后,输出的fd是某个文件的标识。

其中,mode的取值可见于deepinwindows的手册,常用的标志如下,多个标志可通过|叠加,这一股浓郁的C风确认来自操作系统无疑了。

os.open open os.open open
os.O_RDONLY ‘r' os.O_WRONLY ‘w'
os.O_RDWR ‘r+' os.O_APPEND ‘a'
os.O_CREAT 创建并打开

其中相关的函数还有:

os.fdopen(fd, mode, bufsize) 通过fd创建一个文件对象,并返回这个文件对象
os.read(fd, n) 从fd 中读取最多 n 个字节并返回,如果fd对应文件已达到结尾, 则返回空串。
os.write(fd, str) str写入fd,返回实际写入的字符串长度
os.fsync(fd) 强制将fd所对应的文件写入硬盘
os.close(fd) 关闭fd
os.dup(fd) 复制fd
os.dup2(fd, fd2) 将fd1所对应的文件复制给fd2
os.fstat(fd) 返回fd的状态
os.ftruncate(fd, length) 裁剪fd, length不大于文件尺寸
os.isatty(fd) 如果fd已经打开,同时与tty(-like)设备相连,则返回True, 否则False。
os.lseek(fd, pos, how) 设置fd当前位置为pos, how为修改方式,等同于前文中的whence

到此这篇关于深入解读Python如何进行文件读写的文章就介绍到这了,更多相关Python 文件读写内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 机器学习的框架偏向于Python的13个原因

    机器学习的框架偏向于Python的13个原因

    这篇文章主要为大家详细介绍了机器学习的框架偏向于Python的13个原因,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-12-12
  • Python变量类型知识点总结

    Python变量类型知识点总结

    在本文里我们给大家分析一篇关于Python变量类型的相关知识点内容,需要的朋友们跟着学习下。
    2019-02-02
  • python tkinter基本属性详解

    python tkinter基本属性详解

    这篇文章主要介绍了python tkinter基本属性详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-09-09
  • 利用标准库fractions模块让Python支持分数类型的方法详解

    利用标准库fractions模块让Python支持分数类型的方法详解

    最近在工作中遇到了分数处理,查找相关的资料发现可以利用Fraction类来实现,所以下面这篇文章主要给大家介绍了关于利用标准库fractions模块让Python支持分数类型的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下。
    2017-08-08
  • Python中的引用和拷贝浅析

    Python中的引用和拷贝浅析

    这篇文章主要介绍了Python中的引用和拷贝浅析,本文同时讲解了深拷贝和浅拷贝、引用计数和垃圾回收等内容,需要的朋友可以参考下
    2014-11-11
  • python开发任意表达式求值全功能示例

    python开发任意表达式求值全功能示例

    这篇文章主要为大家介绍了python开发任意表达式求值全功能示例,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-07-07
  • 解决Python requests库编码 socks5代理的问题

    解决Python requests库编码 socks5代理的问题

    今天小编就为大家分享一篇解决Python requests库编码 socks5代理的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-05-05
  • python点云地面点滤波(Progressive Morphological Filter)算法介绍(PCL库)

    python点云地面点滤波(Progressive Morphological Filter)算法介绍(PCL库)

    这篇文章主要介绍了python点云地面点滤波(Progressive Morphological Filter)算法介绍(PCL库),了解膨胀/腐蚀这两个基础操作,可以通过对其进行简单组合来形成开/闭操作,需要的朋友可以参考下
    2021-08-08
  • pytorch 在网络中添加可训练参数,修改预训练权重文件的方法

    pytorch 在网络中添加可训练参数,修改预训练权重文件的方法

    今天小编就为大家分享一篇pytorch 在网络中添加可训练参数,修改预训练权重文件的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-08-08
  • 利用Python将社交网络进行可视化

    利用Python将社交网络进行可视化

    这篇文章介绍了利用Python将社交网络进行可视化,主要是一些Python的第三方库来进行社交网络的可视化,利用领英(Linkedin)的社交关系数据展开介绍,内容可当学习练习题有一定的参考价值,需要的小伙伴可以参考一下
    2022-06-06

最新评论