Python可变与不可变数据和深拷贝与浅拷贝
浅拷贝和深拷贝
拷贝函数是专门为可变数据类型list、set、dict使用的一种函数。作用是,当一个值指向另一个值的时候,也不会影响指向的值,如果被指向的数据是可变数据,那么它一旦被修改,指向的数据也会随之改变。
什么是可变数据和不可变数据
我们来举一个例子,整型是不可变的数据,那么为什么是不可变的数据呢?一个数据是不是可变的就要关系到python的缓存机制。
当一个数据发生变化,如果它的内存地址没有发生变化,就说明这是一个可变数据。
比如说,我们现在创建一个值是a的变量,它的值是100,然后让这个数值发生变化,观察者个变量的内存地址是否发生了变化。
a = 100 print(a, id(a)) # 100 1610845392 a += 100 print(a, id(a)) # 200 1610848592
我们发现数值发生了变化,变量的内存也跟着发生了变化,我们再创建一个变量b,值也是整型100
b = 100 print(b, id(b)) # 100 1610845392
发现b的内存地址和a的内存地址是一样的,也就是说,像整型这样的数据类型,一个数字就独占一个内存地址,当某个指向这个值的变量,发生了变化的时候,不是这个变量的值要改变,而是这个变量要寻找改变后的值的内存地址,然后重新的指向它。只要你的硬件不重新启动,那么这个内存地址就永远也不会发生变化了,这样的数据就是不可变数据。
那么,反之就是可变数据,指的就是当变量指向的值发生变化之后,在这个内存地址上的值实打实的发生变化的值,就是可变数据类型。
比如列表,列表发生改变之后,是在原有的基础上发生变化的,所以内存地址是不会改变的,这就是可变数据类型,可变数据类型没有内存缓存机制,不能节省内存,所以一模一样的数据,他们的内存地址可能是不相同的。
a = [1, 2] print(a, id(a)) # [1, 2] 1528536069896 a.append(3) print(a, id(a)) # [1, 2, 3] 1528536069896 # b 和 a的值相同,但是内存地址不相同 b = [1, 2, 3] print(b, id(b)) # [1, 2, 3] 1528536069832
那么拷贝函数是干什么的?
在我们的实际工作当中,经常会使用的一种操作就是定义一个变量,它的值直接就赋给了一个原有的变量之上。可是变量定义之后我们绝不是用来作为一个摆设的,而是要做运算、或者是做一个临时的存储,那么原有的变量的值是要改变的,问题就来了,如果是一个不可变的数据还好,如果是可变的数据,直接的赋值他们的内存地址是相同的, 如果一个变量的值发生变化,同内存地址的的值就都发生改变了,我们的向要临时存储的值也就不再是我们想要的那个值了,这是绝大多数的时候我们不想看到的结果。
我们拿整型为例,变量a直接赋值给变量b,这个时候的变量a b 的值是相同的,但是如果变量a的值发生了变化,是丝毫不影响变量b的值的。
a = 100 print(a, id(a)) # 100 1610845392 b = a print(b, id(b)) # 100 1610845392 a += 100 print(a, id(a)) # 200 1610848592 print(b, id(b)) # 100 1610845392
但是如果是可变数据就不是这样的情况了
a = [1, 2] print(a, id(a)) # [1, 2] 2077688035080 b = a print(b, id(b)) # [1, 2] 2077688035080 a.append(3) print(a, id(a)) # [1, 2, 3] 2077688035080 print(b, id(b)) # [1, 2, 3] 2077688035080
不可变数据的这个特性既是一个优点也是一个缺点,缺点就是如果我们想要保存a变量发生变化之前的的一个状况的时候,是保存不下来的,这个时候就出现了拷贝函数,它可以将可变数据变成不可变数据那样的效果。
浅拷贝
使用拷贝函数,将a变量放入作为参数放入函数中,使用b变量接受函数的返回值,就成功的拷贝了变量a,变量b的内存地址和变量a的不一样,这样当它们其中一方发生变化之后,不会影响到另一方的数据。
# 拷贝函数不能直接使用,需要使用import导入copy模块,copy模块的copy函数就是浅拷贝 import copy a = [1, 2, 3] # 变量b不在直接是变量a的直接赋值了,而是通过copy函数的返回值 b = copy.copy(a) # 他们的数值一样,但是内存地址不同,所以他们之间的任意一方发生变化都不会影响到第二方。 print(a, id(a)) # [1, 2, 3] 2343743813320 print(b, id(b)) # [1, 2, 3] 2343743813192 a.append(4) print(a, id(a)) # [1, 2, 3, 4] 2343743813320 print(b, id(b)) # [1, 2, 3] 2343743813192
但是如果变量a是一个二级容器或者是一个更多级容器,浅拷贝无法拷贝第二级容器或者更多级的容器,所以当第二级容器或者是更多级的容器发生变化的时候,还是会发生变化,因为浅拷贝只能拷贝一级容器,所以多级容器的内存地址还是相同的。
import copy a = [[66,88], 2, 3] b = copy.copy(a) print(a, id(a)) # [[66, 88], 2, 3] 2431683163720 print(b, id(b)) # [[66, 88], 2, 3] 2431683162184 # 改变二级容器 a[0].append(100) print(a, id(a)) # [[66, 88, 100], 2, 3] 2431683163720 print(b, id(b)) # [[66, 88, 100], 2, 3] 2431683162184 # 浅拷贝不能拷贝二级及以上的容器 print(id(a[0])) # 1582481372872 print(id(b[0])) # 1582481372872
深拷贝
浅拷贝只能拷贝一级容器
所以诞生了深拷贝,深拷贝可以拷贝所有级别的容器。
import copy a = [[66,88], 2, 3] # 深拷贝使用deepcopy函数 b = copy.deepcopy(a) print(a, id(a)) # [[66, 88], 2, 3] 2168411158088 print(b, id(b)) # [[66, 88], 2, 3] 2168411156552 a[0].append(100) print(a, id(a)) # [[66, 88, 100], 2, 3] 2168411158088 print(b, id(b)) # [[66, 88], 2, 3] 2168411156552 # 深拷贝所有级别的容器 print(id(a[0])) # 2168411158216 print(id(b[0])) # 2168411122760
总结
使用深浅拷贝需要导入copy模块;
浅拷贝使用copy函数,只能拷贝一级容器的所有元素;
深拷贝使用deepcopy函数,可以拷贝所有级别容器的所有元素;
标准库copy
中只有copy
和deepcopy
两个函数对外开放使用;
因为深拷贝要拷贝的元素跟多,所以速度会远不如浅拷贝,在编程的过程中要注意避免造成多余的系统负担;
python中的不可变数据是Number、string、tuple,可变数据是list、set、dict;而拷贝就是专门为可变数据提供的,所以深浅拷贝只适用于list、set、dict,当然,可变数据使用拷贝函数也不会出错,但是没有意义。
到此这篇关于Python可变与不可变数据和深拷贝与浅拷贝的文章就介绍到这了,更多相关Python数据与拷贝内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
相关文章
用Python的Flask框架结合MySQL写一个内存监控程序
这篇文章主要介绍了用Python的Flask框架结合MySQL些一个内存监控程序的例子,并且能将结果作简单的图形化显示,需要的朋友可以参考下2015-11-11PyTorch 中的 torch.utils.data 解析(推荐)
这篇文章主要介绍了PyTorch torch.utils.data.Dataset概述案例详解,主要介绍对 torch.utils.data.Dataset 的理解,需要的朋友可以参考下2023-02-02
最新评论