9、pandas的填充缺失值fillna()和inplace函数

在数据集里面的缺失值需要填充起来,避免各种出错。

数据源
fillna填充
mean()和sum()填充

fillna可以指定数值进行填充,也可以使用计算公式进行填充,比如df.mean()、df.sum()等。

还可以指定用那一列的数据进行填充:

填充指定的列的数据

在做分析的时候,我们经常要将缺失值填充为前一个值,或者是后一个值,而不是单纯的填充0或者均值。

使用指定method来向前或向后填充

其中‘bfill’就是将缺失值按照面一个值进行填充,'ffill' 就是将缺失值按照面一个值进行填充。

这里的前、后一个数值默认是纵向看的,如果需要使用左或者右边的数值进行填充,只需要加参数axis=1,就可以了。

指定axis = 1为向左向右的数值填充

用limit限制每列可以替代NaN的数目,下面我们限制每列只能替代一个NaN。

限制填充的数目

由于本文档每列只有一个缺失值,所以看起来不明显。

查询是否有缺失值isnull函数:

查询缺失值

还可以用describe()函数计算确实的值:

用describe()函数计算确实值个数  

以上的操作都是没有改变源数据的,如果要改变源数据的话需要添加参数inplace = True才可以改变源数据(也可以用赋值的方式)。

不改变源数据
添加参数inplace = True改变源数据  
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容