一、前言
写程序写的多了,会经常发现很多写法的随意和不正规。比如,a=[1,2] ;b=a;
随后对a的操作是否会给b造成同样的影响呢?(反过来也一样)。说的官方点的话,就是我们用b=a 这样赋值,到底是在引用还是在复制。
二、理论部分
2.1、赋值、引用
在python中赋值语句总是建立对象的引用值,而不是复制对象。因此,python变量更像是指针,而不是数据存储区域。
- 2.1.1 先用个例子,来看
a=[1,2,3]
b=a
a[0]=2
print(a)
print(b)
两个输出的结果都是[2,2,3]
就是说在简单b=a 操作之后,一个对象中赋值的操作也会对另一个引起影响。这其实是引用而不是复制。
- 2.2 可变对象&不可变对象
在Python中,对象分为两种:可变对象和不可变对象,不可变对象包括int,float,long,str,tuple等,可变对象包括list,set,dict等。需要注意的是:这里说的不可变指的是值的不可变。对于不可变类型的变量,如果要更改变量,则会创建一个新值,把变量绑定到新值上,而旧值如果没有被引用就等待垃圾回收。另外,不可变的类型可以计算hash值,作为字典的key。可变类型数据对对象操作的时候,不需要再在其他地方申请内存,只需要在此对象后面连续申请(+/-)即可,也就是它的内存地址会保持不变,但区域会变长或者变短。
说成人话,就是在python里面实打实的数才会占地方(内存),比较高级点的对象都是在引用这些地方的位置(指针)
举个简单例子
举个函数的例子
对于上面的输出,不少Python初学者都比较疑惑:第一个例子看起来像是传值,而第二个例子确实传引用。其实,解释这个问题也非常容易,主要是因为可变对象和不可变对象的原因:对于可变对象,对象的操作不会重建对象,而对于不可变对象,每一次操作就重建新的对象。
三、重要应用
3.1、深拷贝deepcopy与浅拷贝copy(python)
python中的对象之间赋值时是按引用传送的,如果需要拷贝对象,需要使用标准库中的copy模块
1、copy.copy 浅拷贝,只拷贝父对象,不会拷贝对象的内部的子对象。(子对象(数组)修改,也会修改)
2、copy.deepcopy 深拷贝,拷贝对象及其子对象(原始对象)
import copy
a=[1,2,[3,4],{'a':1}] # 原始对象
b=a # 赋值,传对象的引用
c=copy.copy(a) # 对象拷贝,浅拷贝
d=copy.deepcopy(a) # 对象拷贝,深拷贝
e=a[:] # 能复制序列,浅拷贝
a.append('add1') # 修改对象a
a[2].append('add2') # 修改对象a中的[3,4]数组对象
a[3]='666'
print('a:',a)
print('b:',b)
print('c:',c)
print('d:',d)
3.2、深拷贝deepcopy与浅拷贝copy(dataframe)
DataFrame.copy(deep=True)
复制此对象的索引和数据。
当deep=True(默认)时,将使用调用对象的数据和索引的副本创建新对象。对副本的数据或索引的修改不会反映在原始对象中(请参阅下面的注释)。
当deep=False,将创建一个新对象而不复制调用对象的数据或索引(仅复制对数据和索引的引用)。对原始数据的任何更改都将反映在浅层副本中(反之亦然)。
类型 | 备注 | |
---|---|---|
参数 | deep ,bool,默认为True | 创建深层副本,包括数据和索引的副本。随着deep=False无论是指数还是数据复制。 |
返回 | Series,DataFrame | 对象类型与调用者匹配。 |
>>> s = pd.Series([1, 2], index=["a", "b"])
>>> s
a 1
b 2
dtype: int64
>>> s_copy = s.copy()
>>> s_copy
a 1
b 2
dtype: int64