PyTorch中 tensor.detach() 和 tensor.data 的区别解析

 更新时间:2023年04月07日 08:29:00   作者:小瓶盖的猪猪侠  
这篇文章主要介绍了PyTorch中 tensor.detach() 和 tensor.data 的区别解析,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下

PyTorch中 tensor.detach() 和 tensor.data 的区别

以 a.data, a.detach() 为例:
两种方法均会返回和a相同的tensor,且与原tensor a 共享数据,一方改变,则另一方也改变。

所起的作用均是将变量tensor从原有的计算图中分离出来,分离所得tensor的requires_grad = False。

不同点:

data是一个属性,.detach()是一个方法;data是不安全的,.detach()是安全的;

>>> a = torch.tensor([1,2,3.], requires_grad =True)
>>> out = a.sigmoid()
>>> c = out.data
>>> c.zero_()
tensor([ 0., 0., 0.])

>>> out                   #  out的数值被c.zero_()修改
tensor([ 0., 0., 0.])

>>> out.sum().backward()  #  反向传播
>>> a.grad                #  这个结果很严重的错误,因为out已经改变了
tensor([ 0., 0., 0.])

为什么.data是不安全的?

这是因为,当我们修改分离后的tensor,从而导致原tensora发生改变。PyTorch的自动求导Autograd是无法捕捉到这种变化的,会依然按照求导规则进行求导,导致计算出错误的导数值。

其风险性在于,如果我在某一处修改了某一个变量,求导的时候也无法得知这一修改,可能会在不知情的情况下计算出错误的导数值。

>>> a = torch.tensor([1,2,3.], requires_grad =True)
>>> out = a.sigmoid()
>>> c = out.detach()
>>> c.zero_()
tensor([ 0., 0., 0.])

>>> out                   #  out的值被c.zero_()修改 !!
tensor([ 0., 0., 0.])

>>> out.sum().backward()  #  需要原来out得值,但是已经被c.zero_()覆盖了,结果报错
RuntimeError: one of the variables needed for gradient
computation has been modified by an

那么.detach()为什么是安全的?

使用.detach()的好处在于,若是出现上述情况,Autograd可以检测出某一处变量已经发生了改变,进而以如下形式报错,从而避免了错误的求导。

RuntimeError: one of the variables needed for gradient computation has been modified by an inplace operation. Hint: enable anomaly detection to find the operation that failed to compute its gradient, with torch.autograd.set_detect_anomaly(True).

从以上可以看出,是在前向传播的过程中使用就地操作(In-place operation)导致了这一问题,那么就地操作是什么呢?

补充:pytorch中的detach()函数的作用

detach()

官方文档中,对这个方法是这么介绍的。

  • 返回一个新的从当前图中分离的 Variable。
  • 返回的 Variable 永远不会需要梯度 如果 被 detach
  • 的Variable volatile=True, 那么 detach 出来的 volatile 也为 True
  • 还有一个注意事项,即:返回的 Variable 和 被 detach 的Variable 指向同一个 tensor
import torch
from torch.nn import init
from torch.autograd import Variable
t1 = torch.FloatTensor([1., 2.])
v1 = Variable(t1)
t2 = torch.FloatTensor([2., 3.])
v2 = Variable(t2)
v3 = v1 + v2
v3_detached = v3.detach()
v3_detached.data.add_(t1) # 修改了 v3_detached Variable中 tensor 的值
print(v3, v3_detached)    # v3 中tensor 的值也会改变

能用来干啥

可以对部分网络求梯度。

如果我们有两个网络 , 两个关系是这样的 现在我们想用 来为B网络的参数来求梯度,但是又不想求A网络参数的梯度。我们可以这样:

# y=A(x), z=B(y) 求B中参数的梯度,不求A中参数的梯度
y = A(x)
z = B(y.detach())
z.backward()

到此这篇关于PyTorch中 tensor.detach() 和 tensor.data 的区别的文章就介绍到这了,更多相关PyTorch tensor.detach() 和 tensor.data内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python3解析库lxml的安装与基本使用

    python3解析库lxml的安装与基本使用

    lxml是python的一个解析库,支持HTML和XML的解析,支持XPath解析方式,下面这篇文章主要给大家介绍了关于python3解析库lxml的安装与使用的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下
    2018-06-06
  • numpy多项式拟合函数polyfit的使用方法代码

    numpy多项式拟合函数polyfit的使用方法代码

    这篇文章主要给大家介绍了关于numpy多项式拟合函数polyfit的使用方法,np.polyfit是Numpy库中的一个函数,用于在最小二乘意义下拟合多项式曲线到数据点集,需要的朋友可以参考下
    2024-01-01
  • 利用PyQt5模拟实现网页鼠标移动特效

    利用PyQt5模拟实现网页鼠标移动特效

    不知道大家有没有发现,博客园有些博客左侧会有鼠标移动特效。通过移动鼠标,会形成类似蜘蛛网的特效,本文将用PyQt5实现这一特效,需要的可以参考一下
    2022-03-03
  • Python实现前向和反向自动微分的示例代码

    Python实现前向和反向自动微分的示例代码

    自动微分技术(称为“automatic differentiation, autodiff”)是介于符号微分和数值微分的一种技术,它是在计算效率和计算精度之间的一种折衷。本文主要介绍了Python如何实现前向和反向自动微分,需要的可以参考一下
    2022-12-12
  • Python中栈的详细介绍

    Python中栈的详细介绍

    这篇文章主要介绍的是Python中栈,栈(stacks)是一种只能通过访问其一端来实现数据存储与检索的线性数据结构,具有后进先出(last in first out,LIFO)的特征,下面来看看文章的具体举例介绍,需要的朋友可以参考一下
    2021-11-11
  • Python列表(List)知识点总结

    Python列表(List)知识点总结

    在本篇文章中小编给大家分享了关于Python列表(List)知识点一直对应的实例内容,需要的朋友们学习下。
    2019-02-02
  • Django uwsgi Nginx 的生产环境部署详解

    Django uwsgi Nginx 的生产环境部署详解

    这篇文章主要介绍了Django uwsgi Nginx 的生产环境部署详解,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2019-02-02
  • python 多线程共享全局变量的优劣

    python 多线程共享全局变量的优劣

    这篇文章主要介绍了python 多线程共享全局变量的优劣,帮助大家更好的理解和学习python多线程,感兴趣的朋友可以了解下
    2020-09-09
  • 对python中assert、isinstance的用法详解

    对python中assert、isinstance的用法详解

    今天小编就为的就分享一篇对python中assert、isinstance的用法详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-11-11
  • Python3 requests模块如何模仿浏览器及代理

    Python3 requests模块如何模仿浏览器及代理

    这篇文章主要介绍了Python3 requests模块如何模仿浏览器及代理,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-06-06

最新评论