一、模型介绍 GBDT 的全称是 Gradient Boosting Decision Tree,梯度提升决策树。 GBDT 也是集成学习 Boosting 家族的成员,但是...
一、模型介绍 GBDT 的全称是 Gradient Boosting Decision Tree,梯度提升决策树。 GBDT 也是集成学习 Boosting 家族的成员,但是...
一、模型介绍 Adaboost 是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。A...
不同的机器学习任务有着不同的性能评价指标。例如,分类问题,可以使用准确率 (Accuracy)、对数损失函数 (log-loss)、AUC等评价方法。实数序列数据预测问题,可...
一、模型介绍 随机森林是一种由决策树构成的集成算法. 随机森林属于集成学习中的 Bagging. 用随机的方式建立一个森林,森林里面有很多的决策树组成,随机森林的每一棵决策树...
很多业务场景中,我们希望通过一个特定的函数来拟合业务数据,以此来预测未来数据的变化趋势。(比如用户的留存变化、付费变化等)本文主要介绍在 Python 中常用的两种曲线拟合方...
最优化处理寻找一个函数的最小值(最大值或零)的问题。在这种情况下,这个函数被目标函数。本文中,我们使用 scipy.optimize 来进行黑盒优化。 我们不依赖于我们优化的...
正则化是一个通用的算法和思想,所有会产生过拟合现象的算法都可以使用正则化来避免过拟合。在经验风险最小化的基础上(也就是训练误差最小化),尽可能采用简单的模型,可以有效提高泛化...
一、模型介绍 决策树是一类常见的机器学习方法。既可以作为分类算法,也可以作为回归算法。同时也非常适合集成学习。决策树是最简单的机器学习算法,它易于实现,可解释性强,完全符合人...
一、模型介绍 Logistic Regression(逻辑回归)是机器学习中一个非常非常常见的模型,是一种用于解决二分类(0 or 1)问题的机器学习方法。Logistic ...