Avatar notebook default
46篇文章 · 41957字 · 6人关注
  • Resize,w 360,h 240
    关于分类变量

    什么是分类变量 分类变量(categorical variable) 分类变量,用于表示类别或标签类似于维度,描述性的变量,不是单纯的连续性数值...

  • Resize,w 360,h 240
    Logistic回归分析实例

    Logistic回归,即Logistic回归分析,是一种广义的线性回归模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。 Logistic回归...

  • Resize,w 360,h 240
    《Python数据分析与挖掘实战》读书笔记-数据预处理(一)

    《Python数据分析与挖掘实战》,第四章数据预处理 缺失值处理 上一篇说到,处理缺失值的方法有3种:删除记录、数据插补、不处理,这个数据插补,...

  • Resize,w 360,h 240
    连续属性离散化实例

    连续属性离散化,就是将数值型变量转化为离散型变量类似于指标转维度的那种感觉 前面说过,连续属性离散化有几种方式: 等宽法 等频法 聚类分析法 下...

  • Resize,w 360,h 240
    数据规范化实例

    书中的实例,练习数据规范化处理 我们的数据集 首先加载数据集 前面说过,规范化有几种方式 最小-最大规范化 在pandas处理这件事情非常简单 ...

  • Resize,w 360,h 240
    拉格朗日插值法实例

    关于拉格朗日插值法,参考: 拉格朗日插值法 数据集 加载我们的数据集 这个是每天的销量数据 缺失值 前面我们知道,对于缺失值的处理,我们可以使用...

  • 拉格朗日插值法

    scipy.interpolate.lagrange scipy.interpolate.lagrange(x, w) Return a Lag...

  • Resize,w 360,h 240
    《Python数据分析与挖掘实战》读书笔记-数据探索

    《Python数据分析与挖掘实战》,第三章数据探索 前面的内容偏理论,简单整理下,我感觉有点儿用的吧 数据质量分析 数据质量分析的主要任务是检查...

  • Resize,w 360,h 240
    小提琴图-理论篇

    前几天在seaborn中看到了这个图,还以为是什么树叶图,一开始就是觉得图挺有意思,但是并不知道是什么意思,这里就整理一下 我们先看个例子 小提...

文集作者