关于pytorch多GPU训练实例与性能对比分析

 更新时间:2019年08月19日 15:07:30   作者:奏英宇  
今天小编就为大家分享一篇关于pytorch多GPU训练实例与性能对比分析,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

以下实验是我在百度公司实习的时候做的,记录下来留个小经验。

多GPU训练

cifar10_97.23 使用 run.sh 文件开始训练

cifar10_97.50 使用 run.4GPU.sh 开始训练

在集群中改变GPU调用个数修改 run.sh 文件

nohup srun --job-name=cf23 $pt --gres=gpu:2 -n1 bash cluster_run.sh $cmd 2>&1 1>>log.cf50_2GPU &

修改 –gres=gpu:2 即可

Python 文件代码修改

parser.add_argument('--batch_size', type=int, default=96*2, help='batch size')

修改对应 batch size 大小,保证每块GPU获得等量的训练数据,因为batch_size的改变会影响训练精度

最容易实现的单GPU训练改为多GPU训练代码

单GPU:logits, logits_aux = model(input)

多GPU:

if torch.cuda.device_count()>1:#判断是否能够有大于一的GPU资源可以调用

   logits, logits_aux =nn.parallel.data_parallel(model,input)

  else:

   logits, logits_aux = model(input)

缺点:不是性能最好的实现方式

优点:代码嵌入适应性强,不容易报错

性能分析

该图为1到8GPU训练cifar10——97.23网络的实验对比

可以看到单核训练600轮需要53小时、双核训练600轮需要26小时、四核16、六核14、八核13。

在可运行7小时的GPU上的对比实验:单核跑完83轮、双核跑完163轮、四核跑完266轮

结论:性价比较高的是使用4~6核GPU进行训练,但是多GPU训练对于单GPU训练有所差异,训练的准确率提升会有所波动,目前发现的是负面的影响。

以上这篇关于pytorch多GPU训练实例与性能对比分析就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Python实现去除Excel重复数据并统计重复次数

    Python实现去除Excel重复数据并统计重复次数

    这篇文章主要为大家详细介绍了如何利用Python语言实现文本数据去重,创建包含唯一值的新列,并统计文本数据出现的次数,需要的可以参考下
    2023-08-08
  • Python+tkinter实现树形图绘制

    Python+tkinter实现树形图绘制

    Treeview是ttk中的树形表组件,功能十分强大,非常适用于系统路径的表达,下面我们就来看看如何利用这一组件实现树形图的绘制吧,有需要的可以参考下
    2023-09-09
  • Python中卷积神经网络(CNN)入门教程分分享

    Python中卷积神经网络(CNN)入门教程分分享

    卷积神经网络(Convolutional Neural Networks, CNN)是一类特别适用于处理图像数据的深度学习模型,本文介绍了如何使用Keras创建一个简单的CNN模型,并用它对手写数字进行分类,需要的可以参考一下
    2023-05-05
  • Python代码显得Pythonic(区别于其他语言的写法)

    Python代码显得Pythonic(区别于其他语言的写法)

    这篇文章主要介绍了Python代码显得Pythonic(区别于其他语言的写法),对于字符串连接,相比于简单的+,更pythonic的做法是尽量使用%操作符或者format函数格式化字符串,感兴趣的小伙伴和小编一起进入文章了解更详细相关知识内容吧
    2022-02-02
  • Django操作cookie的实现

    Django操作cookie的实现

    很多网站都会使用Cookie。本文主要介绍了Django操作cookie的实现,结合实例形式详细分析了Django框架针对cookie操作的各种常见技巧与操作注意事项,需要的朋友可以参考下
    2021-05-05
  • Python如何配置环境变量详解

    Python如何配置环境变量详解

    今天带大家学习python如何配置环境变量,文中有非常详细的步骤,对正在学习python的小伙伴们有很好地帮助,需要的朋友可以参考下
    2021-05-05
  • python实现字母闪烁效果的示例代码

    python实现字母闪烁效果的示例代码

    本文主要介绍了python实现字母闪烁效果的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-08-08
  • python 五子棋如何获得鼠标点击坐标

    python 五子棋如何获得鼠标点击坐标

    这篇文章主要介绍了python 五子棋如何获得鼠标点击坐标,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-11-11
  • 一个月入门Python爬虫学习,轻松爬取大规模数据

    一个月入门Python爬虫学习,轻松爬取大规模数据

    利用爬虫我们可以获取大量的价值数据,从而获得感性认识中不能得到的信息,这篇文章给大家带来了一个月入门Python学习,爬虫轻松爬取大规模数据,感兴趣的朋友一起看看吧
    2018-01-01
  • Django数据库(SQlite)基本入门使用教程

    Django数据库(SQlite)基本入门使用教程

    django有默认自带的数据库,当然也可以用其他的数据库,下面这篇文章主要给大家介绍了关于Django数据库(SQlite)基本入门使用教程的相关资料,需要的朋友可以参考下
    2022-07-07

最新评论