pandas使用技巧【12】如何处理缺失数据

简介: 本文主要介绍在pandas中如何处理缺失数据。

主要方法有:

  1. isnull()
  2. notnull()
  3. dropna()
  4. fillna()
  • 判断数据是否缺失

使用isnull()函数,返回bool类型数据

dataframe.isnull()

使用notnull()函数,同样返回bool类型数据

dataframe.notnull()

使用sum()函数,统计缺失数据

dataframe.isnull().sum()
  • 过滤缺失数据
dataframe[dataframe.colname.isnull()]
dataframe[dataframe.colname.notnull()]
  • 丢弃缺失数据

how按行row判断

dataframe.dropna(how='any')
dataframe.dropna(how='any', inplace=True)
dataframe.dropna(how='all')
dataframe.dropna(how='all', inplace=True)

对特定列操作

dataframe.dropna(subset=["col1",  "col2"], how='any')
dataframe.dropna(subset=["col1",  "col2"], how='all')
  • 填充缺失数据

fillna()函数


附上小哥哥的视频链接Data analysis in Python with pandas
Youtube 🔗
哔哩哔哩 🔗

所有文章列表
pandas使用技巧总览

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容