什么是分类变量 分类变量(categorical variable) 分类变量,用于表示类别或标签类似于维度,描述性的变量,不是单纯的连续性数值...
Logistic回归,即Logistic回归分析,是一种广义的线性回归模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。 Logistic回归...
《Python数据分析与挖掘实战》,第四章数据预处理 缺失值处理 上一篇说到,处理缺失值的方法有3种:删除记录、数据插补、不处理,这个数据插补,...
连续属性离散化,就是将数值型变量转化为离散型变量类似于指标转维度的那种感觉 前面说过,连续属性离散化有几种方式: 等宽法 等频法 聚类分析法 下...
书中的实例,练习数据规范化处理 我们的数据集 首先加载数据集 前面说过,规范化有几种方式 最小-最大规范化 在pandas处理这件事情非常简单 ...
关于拉格朗日插值法,参考: 拉格朗日插值法 数据集 加载我们的数据集 这个是每天的销量数据 缺失值 前面我们知道,对于缺失值的处理,我们可以使用...
scipy.interpolate.lagrange scipy.interpolate.lagrange(x, w) Return a Lag...
《Python数据分析与挖掘实战》,第三章数据探索 前面的内容偏理论,简单整理下,我感觉有点儿用的吧 数据质量分析 数据质量分析的主要任务是检查...
前几天在seaborn中看到了这个图,还以为是什么树叶图,一开始就是觉得图挺有意思,但是并不知道是什么意思,这里就整理一下 我们先看个例子 小提...
文集作者