DataFrame 删除相同的(即包含)可以用去重的方法
df1 = pd.DataFrame([[1, 2], [4, 6]], columns=['a', 'b'])
df2 = pd.DataFrame([[1, 2], [4, 6], [5, 5]], columns=['a', 'b'])
df = df2.append(df1)
print(df)
print('*' * 50)
df = df.drop_duplicates(subset=['a', 'b'], inplace=False, keep=False)
print(df)
结果
>>>
a b
0 1 2
1 4 6
2 5 5
0 1 2
1 4 6
**************************************************
a b
2 5 5
keep=False 不保留相同的值
keep = 'first' 保留排在最前的相同值
keep = 'last' 保留排在最后的相同值