PyTorch中model.zero_grad()和optimizer.zero_grad()用法

更新时间：2020年06月24日 11:39:10 作者：血雨腥风霜

这篇文章主要介绍了PyTorch中model.zero_grad()和optimizer.zero_grad()用法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

废话不多说，直接上代码吧~

model.zero_grad()
optimizer.zero_grad()

首先，这两种方式都是把模型中参数的梯度设为0

当optimizer = optim.Optimizer(net.parameters())时，二者等效，其中Optimizer可以是Adam、SGD等优化器

def zero_grad(self):
 """Sets gradients of all model parameters to zero."""
 for p in self.parameters():
  if p.grad is not None:
  p.grad.data.zero_()

补充知识：Pytorch中的optimizer.zero_grad和loss和net.backward和optimizer.step的理解

引言

一般训练神经网络，总是逃不开optimizer.zero_grad之后是loss（后面有的时候还会写forward，看你网络怎么写了）之后是是net.backward之后是optimizer.step的这个过程。

real_a, real_b = batch[0].to(device), batch[1].to(device)

fake_b = net_g(real_a)
optimizer_d.zero_grad()

# 判别器对虚假数据进行训练
fake_ab = torch.cat((real_a, fake_b), 1)
pred_fake = net_d.forward(fake_ab.detach())
loss_d_fake = criterionGAN(pred_fake, False)

# 判别器对真实数据进行训练
real_ab = torch.cat((real_a, real_b), 1)
pred_real = net_d.forward(real_ab)
loss_d_real = criterionGAN(pred_real, True)

# 判别器损失
loss_d = (loss_d_fake + loss_d_real) * 0.5

loss_d.backward()
optimizer_d.step()

上面这是一段cGAN的判别器训练过程。标题中所涉及到的这些方法，其实整个神经网络的参数更新过程（特别是反向传播），具体是怎么操作的，我们一起来探讨一下。

参数更新和反向传播

上图为一个简单的梯度下降示意图。比如以SGD为例，是算一个batch计算一次梯度，然后进行一次梯度更新。这里梯度值就是对应偏导数的计算结果。显然，我们进行下一次batch梯度计算的时候，前一个batch的梯度计算结果，没有保留的必要了。所以在下一次梯度更新的时候，先使用optimizer.zero_grad把梯度信息设置为0。

我们使用loss来定义损失函数，是要确定优化的目标是什么，然后以目标为头，才可以进行链式法则和反向传播。

调用loss.backward方法时候，Pytorch的autograd就会自动沿着计算图反向传播，计算每一个叶子节点的梯度（如果某一个变量是由用户创建的，则它为叶子节点）。使用该方法，可以计算链式法则求导之后计算的结果值。

optimizer.step用来更新参数，就是图片中下半部分的w和b的参数更新操作。

以上这篇PyTorch中model.zero_grad()和optimizer.zero_grad()用法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持脚本之家。

您可能感兴趣的文章:

PyTorch使用GPU加速计算的实现
PyTorch利用NVIDIA CUDA库提供的底层接口来实现GPU加速计算,本文就来介绍一下PyTorch使用GPU加速计算的实现,具有一定的参考价值,感兴趣的可以了解一下
2024-02-02
Python用for循环实现九九乘法表
本文通过实例代码给大家介绍了Python用for循环实现九九乘法表的方法，代码简单易懂，非常不错，具有一定的参考借鉴价值，需要的朋友参考下吧
2018-05-05
关于Django使用 django-celery-beat动态添加定时任务的方法
本文给大家介绍Django使用 django-celery-beat动态添加定时任务的方法，安装对应的是celery版本，文中给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友参考下吧
2021-10-10
Python操作Word文件的流程步骤
要操作Word文件，我们需要使用一个Python的第三方库叫做 python-docx，它可以让我们使用 Python对Word文件进行读取、修改以及创建等操作，文中有详细的流程步骤介绍,需要的朋友可以参考下
2023-06-06
Python3.7 dataclass使用指南小结
本文将带你走进python3.7的新特性dataclass，通过本文你将学会dataclass的使用并避免踏入某些陷阱。小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧
2019-02-02
浅谈Python 钉钉报警必备知识系统讲解
这篇文章主要介绍了浅谈Python 钉钉报警必备知识系统讲解，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2020-08-08
Pytorch反向传播中的细节-计算梯度时的默认累加操作
这篇文章主要介绍了Pytorch反向传播中的细节-计算梯度时的默认累加操作，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2021-06-06
Python实现根据Excel生成Model和数据导入脚本
最近遇到一个需求，有几十个Excel，每个的字段都不一样，然后都差不多是第一行是表头，后面几千上万的数据，需要把这些Excel中的数据全都加入某个已经上线的Django项目。所以我造了个自动生成 Model和导入脚本的轮子，希望对大家有所帮助
2022-11-11
使用grappelli为django admin后台添加模板
本文介绍了一款非常流行的Django模板系统--grappelli,以及如何给Django的admin后台添加模板，非常的实用，这里推荐给大家。
2014-11-11
Python向excel中写入数据的方法
这篇文章主要介绍了Python向excel中写入数据，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2019-05-05

PyTorch中model.zero_grad()和optimizer.zero_grad()用法

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具