一、 特征选择的几个常见问题 为什么?(1)降低维度,选择重要的特征,避免维度灾难,降低计算成本(2)去除不相关的冗余特征(噪声)来降低学习的难...
引言 在学习线性回归模型的时候就会遇到基函数,可能我们会遇到多项式基函数、高斯基函数、sigmoid基函数,当然在高等数学和信号系统中还经常会碰...
概述 高斯过程是基于统计学习理论和贝叶斯理论发展起来的一种机器学习方法,适于处理高维度、小样本和非线性等复杂回归问题,且泛化能力强,与神经网络、...
特征选择与特征学习 在机器学习的具体实践任务中,选择一组具有代表性的特征用于构建模型是非常重要的问题。特征选择通常选择与类别相关性强、且特征彼此...
数学的空间 数学中的空间概念是要有研究工作的对象和遵循的规则。其中,包含元素和结构。如线性结构中,定义加法和数乘;拓扑结构中,要有距离、范数、开...
1 聚类分析基本概念 聚类分析将数据划分成有意义或有用的簇。如果目标是划分成有意义的组,则簇应当捕获数据的自然结构。聚类分析是一种分类的多元统计...
引言 在之前学习机器学习技术中,很少关注特征工程(Feature Engineering),然而,单纯学习机器学习的算法流程,可能仍然不会使用这...
引言 上一节中介绍了《随机森林算法》,该算法使用bagging的方式作出一些决策树来,同时在决策树的学习过程中加入了更多的随机因素。该模型可以自...
引入 我们回顾一下之前学习的两个算法,Bagging算法中,通过bootstrapping得到不一样的数据,通过这些数据送到一个基本算法之后,得...
文集作者