原文地址 一、聚类思想 所谓聚类算法是指将一堆没有标签的数据自动划分成几类的方法,属于无监督学习方法,这个方法要保证同一类的数据有相似的特征,如下图所示: 根据样本之间的距离...
原文地址 一、聚类思想 所谓聚类算法是指将一堆没有标签的数据自动划分成几类的方法,属于无监督学习方法,这个方法要保证同一类的数据有相似的特征,如下图所示: 根据样本之间的距离...
原文地址 决策树是一种机器学习的方法。决策树的生成算法有ID3, C4.5和C5.0等。决策树是一种树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的...
本文将通过以下几部分来讲解逻辑回归: 一.分类和回归任务的区别 二.逻辑回归不是回归 三.如果是你,你要怎么做 四.把...
上一章中有提到利用解析解求解多元线性回归,虽然看起来很方便,但是在解析解求解的过程中会涉及到矩阵求逆的步骤.随着维度的增多,矩阵求逆的代价会越来越大(时间/空间),而...
原文地址 多元线性回归概念原文链接: 在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。社会经济现象的变化往往受到多个因素的影响,例如,家庭消费支出,除了受家庭...
这里要讨论特征预处理的相关问题。主要包括特征的归一化和标准化,异常特征样本清洗与样本数据不平衡问题的处理。(原文地址) 1. 特征的标准化和归一化 由于标准化和归一化这两个词...
常见的模型评价和在Python中的实现 python数据挖掘建模中, 第一个步骤是建立一个对象,这个对象是空白的,需要进一步训练的; 然后,设置模型的参数; 接着,通过fit...
一、机器学习基本分类(原文链接): ①监督学习(Supervised learning) 数据集中的每个样本有相应的“正确答案”, 根据这些样本做出 预测, 分有两类: 回归...