Python I/O与进程的详细讲解
I/O
with语句
with context_expression [as target(s)]: with-body
context_expression
返回值遵从上下文管理协议,包含__enter__()
与__exit__()
方法,as语句的target(s)得到的是__enter__()返回值,执行with-body
后会调用上下文管理器的__exit__()方法,使用with语句,可以减轻某些代码编写负担,比如文件读写。
读文件
try: f = open('/path/to/file', 'r', encoding='utf8', errors='ignore') print(f.read(1024)) finally: if f: f.close() # 使用with语句 with open('/path/to/file', 'r') as f: print(f.read(1024))
open()
方法打开文件模式,默认以utf8格式读取,添加后缀'b'(rb、wb)表示以二进制方式读取,mode有以下几种:
StringIO和BytesIO
StringIO将string按照文件的方式读取和写入,BytesIO将bytes按照文件的的方式读取和写入。
OS
通过OS模块,与操作系统信息交互,如创建、移动、列出文件等等。
序列化
通过内置模块pickle,实现序列化与反序列化,使用json模块完成JSON数据的序列化和反序列化。
import pickle d = dict(name = 'sha', age = 26) # 将序列化内容写入文件 with open('dump', 'wb') as f: pickle.dump(d, f) # 从文件中读取序列化内容 with open('dump', 'rb') as f: d = pickle.load(f) print(d) # {'name': 'sha', 'age': 26}
进程与线程
进程
Python调用一次进程fork()
会有两次返回,子进程永远返回0,父进程中返回子进程ID。os.fork()
不支持windows,multiprocessing模块是跨平台版本的多进程模块。
import os pid = os.fork() # pid后的代码会在两个进程中分别执行,通过pid值不同判断父子 if pid == 0: print('exec in child process') else: print('exec in parent process') # exec in parent process # exec in child process
进程池
from multiprocessing import Pool def say(x): print(x) if __name__ == '__main__': p = Pool(4) for i in range(5): p.apply_async(say, args=(i,)) p.close() p.join()
子进程
import subprocess print('$ nslookup amsimple.com') r = subprocess.call(['nslookup', 'amsimple.com']) print('Exit code:', r)
进程间通信
进程间通信通过Queue与Pipes实现,父进程创建Queue传递给子进程。
线程
Python提供两个模块_thread与threading,前者是低级模块后者是高级模块,对_thread进行了封装。
启动一个线程就是把一个函数传入并创建Thread实例,然后调用start()开始执行:
import threading # 新线程执行的代码: def say(): print('%s say hello' % threading.current_thread().name) t = threading.Thread(target=say, name = 'SayThread') t.start() t.join()
threading.current_thread()
返回但前运行线程的实例,主线程名MainTreed,子线程名在创建时指定。
通过threading.Lock()
获取锁,某些需要线程安全的操作,先通过acquire()
获取锁,通过release()
释放锁。
Python中的线程因为GIL锁,无法真正利用多核。
通过ThreadLocal实现线程级的全局变量,不同线程间相互不影响。
import threading th_local = threading.local() # th_local会跟线程绑定,不同线程看到的是不同对象
分布式进程
managers模块依靠网络通信,可以把多进程分布到多台机器上。
正则
通过'r'前缀定义正则字符串,通过re模块做正则匹配等操作。
import re s = r'^[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+$' re.match(s, 'shasharoman@gmail.com')
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对脚本之家的支持。如果你想了解更多相关内容请查看下面相关链接
相关文章
python openpyxl提取Excel图片实现原理技巧
在这篇文章中,将介绍如何使用openpyxl来提取Excel中的图片,以及它的原理和技巧,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪2024-01-01python+selenium+autoit实现文件上传功能
这篇文章主要介绍了python+selenium+autoit实现文件上传功能,需要的朋友可以参考下2017-08-08Python+Qt身体特征识别人数统计源码窗体程序(使用步骤)
这篇文章主要介绍了Python+Qt身体特征识别人数统计源码窗体程序(使用步骤),本文通过示例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下2022-12-12
最新评论