本文来自 https://mp.weixin.qq.com/s/ZNGM8CpFXVikf1wwLJcLtQ
1.items()方法
2.iterrows()方法
3.insert()方法
4.assign()方法
5.eval()方法
6.pop()方法
7.truncate()方法
8.count()方法
9.clip()方法
10.filter()方法
11.isin()方法
items()方法
pandas当中的items()方法可以用来遍历数据集当中的每一列,同时返回列名以及每一列当中的内容,通过以元组的形式,示例如下
df = pd.DataFrame({'species': ['bear', 'bear', 'marsupial'],
'population': [1864, 22000, 80000]},
index=['panda', 'polar', 'koala'])
for label, content in df.items():
print(f'label: {label}')
print(f'content: {content}', sep='\n')
print("=" * 50)
iterrows()方法
而对于iterrows()方法而言,其功能则是遍历数据集当中的每一行,返回每一行的索引以及带有列名的每一行的内容,示例如下
for label, content in df.iterrows():
print(f'label: {label}')
print(f'content: {content}', sep='\n')
print("=" * 50)
insert()方法
insert()方法主要是用于在数据集当中的特定位置处插入数据,示例如下
df.insert(1, "size", [2000, 3000, 4000])
assign()方法
assign()方法可以用来在数据集当中添加新的列,示例如下
df.assign(size_1=lambda x: x.population * 9 / 5 + 32)
eval()方法
eval()方法主要是用来执行用字符串来表示的运算过程的,例如
df.eval("size_3 = size_1 + size_2")
pop()方法
pop()方法主要是用来删除掉数据集中特定的某一列数据
df.pop("size_3")
truncate()方法
truncate()方法主要是根据行索引来筛选指定行的数据的,示例如下
df.truncate(before=2, after=4)
clip()方法
clip()方法主要是通过设置阈值来改变数据集当中的数值,当数值超过阈值的时候,就做出相应的调整
df.clip(lower = -4, upper = 4)
filter()方法
pandas当中的filter()方法是用来筛选出特定范围的数据的,示例如下
df.filter(items=['one', 'three'])
isin()方法
isin()方法主要是用来确认数据集当中的数值是否被包含在给定的列表当中
df = pd.DataFrame(np.array(([1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12])),
index=['A', 'B', 'C', 'D'],
columns=['one', 'two', 'three'])
df.isin([3, 5, 12])
#return bool