解决Pytorch内存溢出,Ubuntu进程killed的问题

更新时间：2021年05月28日 10:45:54 作者：Coding呆呆

这篇文章主要介绍了解决Pytorch内存溢出,Ubuntu进程killed的问题，具有很好的参考价值，希望对大家有所帮助。

pytorch显存越来越多的一个原因

optimizer.zero_grad()
loss.backward()
optimizer.step()
train_loss += loss

参考了别人的代码发现那句loss一般是这样写

loss_sum += loss.data[0]

这是因为输出的loss的数据类型是Variable。而PyTorch的动态图机制就是通过Variable来构建图。主要是使用Variable计算的时候，会记录下新产生的Variable的运算符号，在反向传播求导的时候进行使用。如果这里直接将loss加起来，系统会认为这里也是计算图的一部分，也就是说网络会一直延伸变大那么消耗的显存也就越来越大。

用Tensor计算要写成：

train_loss += loss.item()

correct_total += torch.eq(predict, label_batch).sum().item()
train_loss += loss.item()

当需要将模型中变量提取出来参与计算时，需要使用** .item()**

补充：linux下运行pytorch程序显示“killed”或者“已杀死”

这是由pytorch对于内存不足的反应，确切说，是Linux内核对pytorch程序占用太多内存的反应。Linux内核一旦因为内存资源不足而生气的时候，会使用OOM killer将占用内存最多的进程杀掉。

这种情况下，pytorch的python程序根本就来不及显示相关的内存日志，直接在呼喊出killed这一个简短有力的词语后，就game over了。如果不提前掌握这个背景的话，你可真是会手足无措啊。

既然我们确定了是内存不足导致的问题（dmesg也能明确的显示出kernel把占了近10个GB的python进程给kill了），

那我们的解决方案就有2个：

第一个是加大内存，将我的x99平台的内存从16GB增加到64GB；这个方案先放弃了，因为内存条涨价太猛，我买不起了；

第二个是增加swap分区，当然性能会降低，但不需要额外增加成本。所以Gemfield今天的选择就是第二个方案。

1、先禁止掉swap功能

sudo swapoff /swapfile

这个命令执行之后，如果你用free命令查看的话会发现swap分区的大小变为了0。

2、增加 /swapfile的大小

sudo dd if=/dev/zero of=/swapfile bs=1M count=30720 oflag=append conv=notrunc

这个命令会在现有的/swapfile后面追加30GB，加上之前的2GB的swap分区，现在共有32个GB的swap分区了。如果按照固态硬盘128GB有300多块钱来算的话，这个命令花了七八十块钱呢。

3、设置这个文件为swap分区的挂载点：

sudo mkswap /swapfile

4、再次启用swap

sudo swapon /swapfile

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。

您可能感兴趣的文章:

Django CBV与FBV原理及实例详解
这篇文章主要介绍了Django CBV与FBV原理及实例详解,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2019-08-08
Python操作csv文件实例详解
这篇文章主要为大家详细介绍了Python操作csv文件的实例，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2017-07-07
Python+Requests+PyTest+Excel+Allure 接口自动化测试实战
本文主要介绍了Python+Requests+PyTest+Excel+Allure 接口自动化测试实战，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2023-02-02
python带参数打包exe及调用方式
今天小编就为大家分享一篇python带参数打包exe及调用方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-12-12
pyQt4实现俄罗斯方块游戏
这篇文章主要为大家详细介绍了pyQt4实现俄罗斯方块游戏，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2018-06-06
利用python程序生成word和PDF文档的方法
这篇文章主要给大家介绍了利用python程序生成word和PDF文档的方法，文中给出了详细的介绍和示例代码，相信对大家具有一定的参考价值，有需要的朋友们下面来一起看看吧。
2017-02-02
Django 2.0版本的新特性抢先看！
12 月 2 日，Python Web 开发框架 Django 官网发文宣布推送 Django 2.0 版。在 Django 2.0 的发布说明中，最大吸引注意的内容就是兼容性。，下面这篇文章主要给大家介绍了关于Django 2.0版本的新特性的相关资料，需要的朋友可以参考下。
2018-01-01
python集成开发环境配置(pycharm)
本文是python快速进阶系列文章的第一篇,给大家介绍的是python集成开发环境pycharm的配置,有需要的小伙伴可以参考下
2020-02-02
python set集合使用方法解析
这篇文章主要介绍了python set集合使用方法解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2019-11-11
matlab绘制局部放大图图文教程
这篇文章主要给大家介绍了关于matlab绘制局部放大图的相关资料,所谓局部放大即呈现子图,以显示局部细节,需要的朋友可以参考下
2023-07-07