第七节 pandas函数应用
1. 直接使用numpy函数
-
求绝对值
-
求最大值,默认axis=0为列
2. apply和applymap
2.1 apply将函数应用到行或者列,默认axis=0方向为列
-
求各行列最大值(匿名函数)
2.2 匿名函数一行解决不了时,可以选择自定义函数
-
求各行列最大值(自定义函数)
2.3 在一个数组中沿轴应用一个函数
-
求各行列最大值(应用自定义函数)
2.4 applymap将函数应用到每个数据
-
保留两位小数
3. 排序
3.1 按索引排序s1.sort_index() # ascending=True 默认升序
-
s1.sort_index(axis=0, level=None, ascending=True, inplace=False, kind='quicksort', na_position='last', sort_remaining=True)
3.2 按轴排序
3.3 按值排序
-
s1.sort_values(axis=0, ascending=True, inplace=False, kind='quicksort', na_position='last')
- 注意相同值的优先级
- pd1.sort_values(by, axis=0, ascending=True, inplace=False, kind='quicksort', na_position='last')
-
by行或列的排序优先级
4. 唯一值和成员属性
5.数据个数统计
6. 处理缺失值
6.1 检测缺失值 df3.isnull()
6.2 检测非缺失值 df3.notnull()
6.3 删除,默认删除缺失值所在的行 df3.dropna()
- df3.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
- “how='any':如果存在任何NA值,请删除该行或列。
-
“how='all':如果所有值均为NA,则删除该行或列。
6.4 填充缺失值 df3.fillna(1)
-
用平均值填充缺失值
- 上下填充
- df3.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)
- method='pad'或'ffill'将上一个有效数据往下填充
-
method='backfill'或'bfill'将下一个有效数据往上填充