240 发简信
IP属地:陕西
  • 120
    AdaBoost算法介绍

    1. Boosting Boosting(提升方法)是将弱学习器算法提升为强学习算法的统计学习方法。在分类问题中,提升方法通过反复修改训练数据的权值分布,构建一系列基本分类器...

  • 120
    梯度下降算法的Python实现

    在上一篇逻辑回归中,我们利用批量梯度下降算法BGD求解使损失函数J(θ)取得最小值的θ,同时也提到了SGD和MBGD,本篇我们实现下这三个算法,并进行简单比较。关于梯度下降算...

  • 120
    美团机器学习实践第二章-特征工程总结

    思维导图如下: 在机器学习应用中,特征工程扮演重要的角色,可以说特征工程时机器学习应用的基础。我们都知道,数据和特征决定了机器学习算法的上限,而模型和算法只是不断逼近这个上限...

  • 120
    美团机器学习实践第一章-问题建模总结

    思维导图如下: 机器学习解决问题的通用流程 问题建模-特种工程-模型选择-模型融合。 问题建模应包含三方面的内容:评估指标、样本选择、交叉验证。 评估指标 评估指标很多,我们...

  • 评分卡模型开发-定量特征筛选

    在模型开发中,并不是所有的特征要全部筛选进模型,因为金融数据一般特征有很多,如果全部放入模型,一方面可能会引起“维度灾难”,另一方面得到的结果也许并不是最好的,因为有些特征之...

  • 120
    逻辑回归(Logistic Regression)

    逻辑回归(Logistic Regression)是一种用于分类问题的算法。 建立一个Logistic Regression模型,需要以下三部分工作: 构造预测函数 构建损失...

  • 120
    深度学习--biLSTM_CRF 命名实体识别

    前文 中文分词、词性标注、命名实体识别是自然语言理解中,基础性的工作,同时也是非常重要的工作。在很多NLP的项目中,工作开始之前都要经过这三者中的一到多项工作的处理。在深度学...

  • 120
    文本分类--CNN

    作为一个NLP届的菜鸟,想把自己学到的一点知识写下来,一是帮助自己梳理知识;二是希望能够帮到一些打算入门以及正在入门的NLPer.由于我的文笔挺差的,以及学识有限,有不忍直视...

  • 120
    第三章:数据探索

    3.1餐饮销售额数据异常值检测 2数据特征分析 分布分析:分布分析能揭示数据的分布特征和分布类型;定量数据的分布分析; 3Python主要数据探索函数: python中用于数...

  • 120
    深度学习--Lstm+CNN 文本分类

    本文从实践的角度,来讲一下如何构建LSTM+CNN的模型对文本进行分类。 本文Github RNN网络与CNN网络可以分别用来进行文本分类。RNN网络在文本分类中,作用是用来...

  • 120
    深度学习--RNN+Attention 文本分类

    之前介绍过RNN的分类,本文介绍一下使用预训练词向量进行RNN+Attention的分类模型。 下面来正式开始,RNN+Attention在tensorflow中的实现。 运...

  • 120
    分类模型评估指标

    本篇先考虑二分类问题,记录常用到的评估指标。 混淆矩阵 假设在训练之前和预测之后,一个样本的标记是确定的两个类别,一个是真实的1/0,一个是预测的1/0,其中1表示正例、0表...

个人介绍
做一个快乐学习的篮球迷