pytorch中关于backward的几个要点说明

 更新时间:2023年02月21日 08:42:19   作者:老李今天学习了吗  
这篇文章主要介绍了pytorch中关于backward的几个要点说明,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

pytorch中backward的2个要点

1. requires_grad

用pytorch定义一个网络层,如果数据中加入requires_grad=True,那么对于这个变量而言,就有了属于自己的导数(grad),如果这个数据是矩阵,那么他的grad是同样大小的一个矩阵。

我们将requires_grad视为该变量的一个属性,我们知道,我们在现实生活中,或者说在神经网络中,大部分的函数都是一阶连续可微的,也就是说,他的梯度具有唯一性。requires_grad的存在非常合理。

2. scale才能有backward

scale是标量的意思。

首先我们可用用如下语句查看等式中某个自变量的梯度。

print(x.grad, y.grad)

但是有个前提,我们必须要先对他的结果使用.backward()才能去查看,不然的话,他的梯度会显示为none。

非常需要注意的一点是,能够使用.backward()的必须是标量(scale),不然程序会报错。

结合实际的情况,我们看任何一个网络,使用backward的地方几乎只有一个,那就是loss.backward()。

首先loss肯定是一个标量,无论是MSE还是交叉熵,也无论是否加上了正则项,那都是求和之后的结果,也就是一个数值。这一点非常重要。

以下是我随意写的一个网络层,可以感受一下

import torch
import torch.nn as nn
class Linear(nn.Module):
    def __init__(self, inc, mult):
        super(Linear, self).__init__()
        self.intc = inc
        self.mult = mult
    def forward(self, input0):
        return torch.sum(torch.abs(input0*self.mult+self.intc))
def main():
    x = torch.tensor(1.0, requires_grad=True)
    y = torch.tensor(2.0,requires_grad=True)
    z = x**2+y
    p = z*2+x
    p.backward()
    print(z, x.grad, y.grad)
    A = torch.ones([3,3],requires_grad=True)
    print(A.requires_grad)
    f = Linear(1, -2)
    b = f(A)
    print(b)
    b.backward()
    print(A.grad)
if __name__ == '__main__':
    main()

pytorch中backward参数含义

1.标量与矢量问题

backward参数是否必须取决于因变量的个数,从数据中表现为标量和矢量;

  • 例如标量时
  • y=一个明确的值
  • 矢量时
  • y=[y1,y2]

2.backward 参数计算公式

当因变量公式不是一个标量时,需要显式添加一个参数进行计算,以pytorch文档示例说明:

import torch

a = torch.tensor([2., 3.], requires_grad=True)
b = torch.tensor([6., 4.], requires_grad=True)
Q = 3*a**3 - b**2

例如求解公式

external_grad = torch.tensor([1., 1.])
Q.backward(gradient=external_grad)

可以看到backward参数为[1,1],具体计算的含义,我们把Q公式拆分为标量形式即:

backward参数为[1,1],计算公式为

3.autograd

torch.autograd是计算向量和雅可比公式的乘积的引擎:

其中J就是因变量与自变量的雅可比公式,v即backward中的参数;类比于第二节的例子可对应;

前向传播得到数值后,利用此形式计算直接后向传播计算出损失函数对应各权值的梯度下降值

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • 如何将matlab数据导入到Python中使用

    如何将matlab数据导入到Python中使用

    这篇文章主要介绍了如何将matlab数据导入到Python中使用,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-12-12
  • 使用PyQt5实现图片查看器的示例代码

    使用PyQt5实现图片查看器的示例代码

    这篇文章主要介绍了使用PyQt5实现图片查看器的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-04-04
  • Django路由层如何获取正确的url

    Django路由层如何获取正确的url

    本文介绍路由层是如何进行路由匹配的,以diango1.x版本为例,文中通过示例代码介绍的非常详细,文中通过示例代码介绍的非常详细,
    2021-07-07
  • pandas 实现将两列中的较大值组成新的一列

    pandas 实现将两列中的较大值组成新的一列

    这篇文章主要介绍了pandas 实现将两列中的较大值组成新的一列,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-03-03
  • Python数据结构列表

    Python数据结构列表

    这篇文章主要介绍了Python数据结构列表,本文重点内容主要是对列表数据结构的使用,在Python中,序列是一组按顺序排列的值。Python 有 3 种内置的序列类型:字符串、 元组和列表,下面一起进入文章了解更详细内容吧,需要的小伙伴可以参考一下</P><P>
    2021-12-12
  • python-itchat 统计微信群、好友数量,及原始消息数据的实例

    python-itchat 统计微信群、好友数量,及原始消息数据的实例

    今天小编就为大家分享一篇python-itchat 统计微信群、好友数量,及原始消息数据的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-02-02
  • 在Python中通过getattr获取对象引用的方法

    在Python中通过getattr获取对象引用的方法

    今天小编就为大家分享一篇在Python中通过getattr获取对象引用的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-01-01
  • Pthon批量处理将pdb文件生成dssp文件

    Pthon批量处理将pdb文件生成dssp文件

    这篇文章主要介绍了Pthon批量处理将pdb文件生成dssp文件,通过本例主要学习遍历目录下文件的方法,需要的朋友可以参考下
    2015-06-06
  • Python中%r和%s的详解及区别

    Python中%r和%s的详解及区别

    这篇文章主要介绍了Python中%r和%s的详解及区别的相关资料,需要的朋友可以参考下
    2017-03-03
  • Pycharm中import torch报错,python中import torch不报错的解决

    Pycharm中import torch报错,python中import torch不报错的解决

    这篇文章主要介绍了Pycharm中import torch报错,python中import torch不报错的解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-01-01

最新评论