Python 并行加速技巧分享

 更新时间:2022年05月19日 16:31:14   作者:Python数据挖掘  
这篇文章主要介绍了Python 并行加速技巧分享,文章围绕文章主题展开详细的内容介绍,具有一定的参考价值,需要的小伙伴可以参考一下

1 前言

我们在日常使用Python进行各种数据计算处理任务时,若想要获得明显的计算加速效果,最简单明了的方式就是想办法将默认运行在单个进程上的任务,扩展到使用多进程或多线程的方式执行。

而对于我们这些从事数据分析工作的人员而言,以最简单的方式实现等价的加速运算的效果尤为重要,从而避免将时间过多花费在编写程序上。

而今天我就来带大家学习如何利用joblib这个非常简单易用的库中的相关功能,来快速实现并行计算加速效果。

2 使用joblib进行并行计算

作为一个被广泛使用的第三方Python库(譬如scikit-learn项框架中就大量使用joblib进行众多机器学习算法的并行加速),我们可以使用pip install joblib对其进行安装,安装完成后,下面我们来学习一下joblib中有关并行运算的常用方法:

2.1 使用Parallel与delayed进行并行加速

joblib中实现并行计算只需要使用到其Parallel和delayed方法即可,使用起来非常简单方便

下面我们直接以一个小例子来演示:

joblib实现并行运算的思想是将一组通过循环产生的串行计算子任务,以多进程或多线程的方式进行调度,而我们针对自定义的运算任务需要做的仅仅是将它们封装为函数的形式即可,譬如:

import time
def task_demo1():
    time.sleep(1)
    return time.time()

接着只需要像下面的形式一样,为Parallel()设置相关参数后,衔接循环创建子任务的列表推导过程,其中利用delayed()包裹自定义任务函数,再衔接()传递任务函数所需的参数即可,其中n_jobs参数用于设置并行任务同时执行的worker数量,因此在这个例子中可以看到进度条是按照4个一组递增的,

可以看到最终时间开销也达到了并行加速效果:

其中可以根据计算任务以及机器CPU核心数具体情况为Parallel()调节参数,核心参数有:

  • backend:用于设置并行方式,其中多进程方式有'loky'(更稳定)和'multiprocessing'两种可选项,多线程有'threading'一种选项。默认为'loky'
  • n_jobs:用于设置并行任务同时执行的worker数量,当并行方式为多进程时,n_jobs最多可设置为机器CPU逻辑核心数量,超出亦等价于开启全部核心,你也可以设置为-1来快捷开启全部逻辑核心,若你不希望全部CPU资源均被并行任务占用,则可以设置更小的负数来保留适当的空闲核心,譬如设置为-2则开启全部核心-1个核心,设置为-3则开启全部核心-2个核心

譬如下面的例子,在我这台逻辑核心数为8的机器上,保留两个核心进行并行计算:

关于并行方式的选择上,由于Python中多线程时全局解释器锁的限制,如果你的任务是计算密集型,则推荐使用默认的多进程方式加速,如果你的任务是IO密集型譬如文件读写、网络请求等,则多线程是更好的方式且可以将n_jobs设置的很大,举个简单的例子,可以看到,通过多线程并行,我们在5秒的时间里完成了1000次请求,远快于单线程17秒请求100次的成绩

我们可以根据自己实际任务的不同,好好利用joblib来加速你的日常工作。

到此这篇关于Python 并行加速技巧分享的文章就介绍到这了,更多相关Python 加速内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python实现RLE格式与PNG格式互转

    Python实现RLE格式与PNG格式互转

    在机器视觉领域的深度学习中,很多数据集的标注文件使用RLE的格式。但是神经网络的输入一定是一张图片,为此必须把RLE格式的文件转变为图像格式。本文将利用Python实现RLE格式与PNG格式互转,感兴趣的可以了解一下
    2022-08-08
  • python使用NumPy文件的读写操作

    python使用NumPy文件的读写操作

    这篇文章主要介绍了python使用NumPy读写文本文件。想了解第三方库文件操作的同学,来看一下吧
    2021-04-04
  • Python脚本实现下载合并SAE日志

    Python脚本实现下载合并SAE日志

    这篇文章主要介绍了Python脚本实现下载合并SAE日志,本文讲解了代码编写过程,然后给出了完整代码,需要的朋友可以参考下
    2015-02-02
  • python中列表的含义及用法

    python中列表的含义及用法

    在本篇文章里小编给大家分享的是关于python中列表的含义及用法,需要的朋友们可以参考学习下。
    2020-05-05
  • flask + pymysql操作Mysql数据库的实例

    flask + pymysql操作Mysql数据库的实例

    下面小编就为大家带来一篇flask + pymysql操作Mysql数据库的实例。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-11-11
  • 浅谈Python的Django框架中的缓存控制

    浅谈Python的Django框架中的缓存控制

    这篇文章主要介绍了Python的Django框架中的缓存控制,包括Vary头部以外的其他头部使用等,需要的朋友可以参考下
    2015-07-07
  • pandas.DataFrame.iloc的具体使用详解

    pandas.DataFrame.iloc的具体使用详解

    本文主要介绍了pandas.DataFrame.iloc的具体使用详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-06-06
  • python 基于wx实现音乐播放

    python 基于wx实现音乐播放

    这篇文章主要介绍了python 基于wx实现音乐播放的示例代码,帮助大家更好的理解和学习python,感兴趣的朋友可以了解下
    2020-11-11
  • python添加模块搜索路径方法

    python添加模块搜索路径方法

    下面小编就为大家带来一篇python添加模块搜索路径方法。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-09-09
  • Python JMESPath库轻松操作JSON进行数据查询方法实例

    Python JMESPath库轻松操作JSON进行数据查询方法实例

    这篇文章主要为大家介绍了Python JMESPath库轻松操作JSON方法实例,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2024-01-01

最新评论