pytorch的backward()的底层实现逻辑详解

更新时间：2023年11月20日 11:34:16 作者：子燕若水

自动微分是一种计算张量（tensors）的梯度（gradients）的技术,它在深度学习中非常有用,这篇文章主要介绍了pytorch的backward()的底层实现逻辑,需要的朋友可以参考下

自动微分是一种计算张量（tensors）的梯度（gradients）的技术，它在深度学习中非常有用。自动微分的基本思想是：

自动微分会记录数据（张量）和所有执行的操作（以及产生的新张量）在一个由函数（Function）对象组成的有向无环图（DAG）中。在这个图中，叶子节点是输入张量，根节点是输出张量。通过从根节点到叶子节点追踪这个图，可以使用链式法则（chain rule）自动地计算梯度。

在前向传播（forward pass）中，自动微分同时做两件事：
- 运行请求的操作来计算一个结果张量，以及
- 在 DAG 中保留操作的梯度函数。
- 在 DAG 中保留操作的梯度函数，这就是说，当你给自动微分一个张量和一个操作，它不仅会计算出结果张量，还会记住这个操作的梯度函数，也就是这个操作对输入张量的导数。例如，如果你给自动微分一个张量 x = [1, 2, 3] 和一个操作 y = x + 1，它不仅会计算出 y = [2, 3, 4]，还会记住这个操作的梯度函数是 dy/dx = 1，也就是说，y 对 x 的导数是 1。这样，当你需要计算梯度时，自动微分就可以根据这个梯度函数来计算出结果张量对输入张量的梯度。
在PyTorch中，DAG是动态的。需要注意的一点是，图是从头开始重新创建的;在每个 .backward() 调用之后，autograd开始填充一个新的图。
后向传播开始于当在 DAG 的根节点上调用 .backward() 方法。这个方法会触发自动微分开始计算梯度。
自动微分会从每个 .grad_fn 中计算梯度，这个 .grad_fn 是一个函数对象，它保存了操作的梯度函数。例如，如果一个操作是 y = x + 1，那么它的 .grad_fn 就是 dy/dx = 1。
自动微分会将计算出的梯度累加到相应张量的 .grad 属性中，这个 .grad 属性是一个张量，它保存了结果张量对输入张量的梯度。例如，如果一个结果张量是 y = [2, 3, 4]，那么它的 .grad 属性就是 [1, 1, 1]，表示 y 对 x 的梯度是 1。
使用链式法则（chain rule），自动微分会一直向后传播，直到到达叶子张量。链式法则是一种数学公式，它可以将复合函数的梯度分解为简单函数的梯度的乘积。例如，如果一个复合函数是 z = f(g(x))，那么它的梯度是 dz/dx = dz/dg * dg/dx。

 
import torch
import torch.nn as nn
M = nn.Linear(2, 2) # neural network module
M.eval() # set M to evaluation mode
with torch.no_grad(): # disable gradient computation
    for param in M.parameters(): # loop over all parameters
        param.fill_(1) # fill the parameter with 1
M.requires_grad_(False)
a = torch.tensor([1., 2.], requires_grad=True) # leaf node
b = torch.tensor([13., 32.], requires_grad=True) # leaf node
c = M(a) # non-leaf node
c2 = M(b) # non-leaf node
d = c * 2  # non-leaf node
d.sum().backward() # compute gradients
print(a.grad)
print(b.grad)
print(c.grad)
print(d.grad)
print(M.weight.grad) # None

构建计算图:当我们调用backward()方法时，PyTorch会自动构建从叶子节点a到损失值d.sum()的计算图，这是一个有向无环图，表示了各个张量之间的运算关系。计算图中还包含了两个中间变量c和d，它们是由a经过M模型的前向传播得到的。计算图的作用是记录反向传播的路径，以便于计算梯度。计算梯度:在计算图中，每个张量都有一个属性grad，用于存储它的梯度值。当我们调用backward()方法时，PyTorch会沿着计算图按照链式法则计算并填充每个张量的grad属性。由于我们只对叶子节点a的梯度感兴趣，所以只有a的grad属性会被计算出来，而中间变量c和d的grad属性会被忽略。a的grad属性的值是损失值d.sum()对a的偏导数，表示了a的变化对损失值的影响。

到此这篇关于pytorch的backward()的底层实现逻辑的文章就介绍到这了,更多相关pytorch backward()内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

Python预测2020高考分数和录取情况
这篇文章主要介绍了Python预测2020高考分数和录取情况可能是这样,本文通过示例代码给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2020-07-07
在Python中过滤Windows文件名中的非法字符方法
今天小编就为大家分享一篇在Python中过滤Windows文件名中的非法字符方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-06-06
python中的列表和元组区别分析
这篇文章主要介绍了python中的列表和元组区别分析,需要的朋友可以参考下
2020-12-12
OpenCV绘制圆角矩形的方法实例
我们在轮廓截取出来时一般需要是矩形的图像,所以下面这篇文章主要给大家介绍了关于OpenCV绘制圆角矩形的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下
2021-08-08
基于Python实现商场抽奖小系统
这篇文章主要为大家详细介绍了如何利用Python语言实现一个简单的商场抽奖小系统，文中的示例代码讲解详细，感兴趣的小伙伴可以了解一下
2022-08-08
Python合并多个Excel数据的方法
这篇文章主要介绍了Python合并多个Excel数据的方法也就是说将多个excel中的数据合并到另一个表中，本文通过实例代码相结合的形式给大家介绍的非常详细，具有一定的参考借鉴价值，需要的朋友参考下吧
2018-07-07
Python实现读取JSON并导出为表格数据格式
这篇文章主要为大家详细介绍了如何基于Python语言,读取JSON格式的数据,并将提取的指定内容保存到表格文件中,感兴趣的小伙伴可以跟随小编一起学习一下
2024-03-03
Python学习笔记之错误和异常及访问错误消息详解
这篇文章主要介绍了Python学习笔记之错误和异常及访问错误消息,结合实例形式分析了Python错误和异常及访问错误消息try...except语句相关使用技巧,需要的朋友可以参考下
2019-08-08
Python使用sqlite3模块内置数据库
这篇文章主要介绍了Python使用sqlite3模块内置数据库,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-05-05
python制作朋友圈九宫格图片
这篇文章主要为大家详细介绍了python制作朋友圈九宫格图片，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2019-11-11

pytorch的backward()的底层实现逻辑详解

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具