1. Boosting Boosting(提升方法)是将弱学习器算法提升为强学习算法的统计学习方法。在分类问题中,提升方法通过反复修改训练数据的权值分布,构建一系列基本分类器...
1. Boosting Boosting(提升方法)是将弱学习器算法提升为强学习算法的统计学习方法。在分类问题中,提升方法通过反复修改训练数据的权值分布,构建一系列基本分类器...
在上一篇逻辑回归中,我们利用批量梯度下降算法BGD求解使损失函数J(θ)取得最小值的θ,同时也提到了SGD和MBGD,本篇我们实现下这三个算法,并进行简单比较。关于梯度下降算...
思维导图如下: 在机器学习应用中,特征工程扮演重要的角色,可以说特征工程时机器学习应用的基础。我们都知道,数据和特征决定了机器学习算法的上限,而模型和算法只是不断逼近这个上限...
思维导图如下: 机器学习解决问题的通用流程 问题建模-特种工程-模型选择-模型融合。 问题建模应包含三方面的内容:评估指标、样本选择、交叉验证。 评估指标 评估指标很多,我们...
在模型开发中,并不是所有的特征要全部筛选进模型,因为金融数据一般特征有很多,如果全部放入模型,一方面可能会引起“维度灾难”,另一方面得到的结果也许并不是最好的,因为有些特征之...
逻辑回归(Logistic Regression)是一种用于分类问题的算法。 建立一个Logistic Regression模型,需要以下三部分工作: 构造预测函数 构建损失...
前文 中文分词、词性标注、命名实体识别是自然语言理解中,基础性的工作,同时也是非常重要的工作。在很多NLP的项目中,工作开始之前都要经过这三者中的一到多项工作的处理。在深度学...
作为一个NLP届的菜鸟,想把自己学到的一点知识写下来,一是帮助自己梳理知识;二是希望能够帮到一些打算入门以及正在入门的NLPer.由于我的文笔挺差的,以及学识有限,有不忍直视...
3.1餐饮销售额数据异常值检测 2数据特征分析 分布分析:分布分析能揭示数据的分布特征和分布类型;定量数据的分布分析; 3Python主要数据探索函数: python中用于数...
本文从实践的角度,来讲一下如何构建LSTM+CNN的模型对文本进行分类。 本文Github RNN网络与CNN网络可以分别用来进行文本分类。RNN网络在文本分类中,作用是用来...
之前介绍过RNN的分类,本文介绍一下使用预训练词向量进行RNN+Attention的分类模型。 下面来正式开始,RNN+Attention在tensorflow中的实现。 运...
本篇先考虑二分类问题,记录常用到的评估指标。 混淆矩阵 假设在训练之前和预测之后,一个样本的标记是确定的两个类别,一个是真实的1/0,一个是预测的1/0,其中1表示正例、0表...