集成学习Ensemble Learning 集成学习是一种思想而不是一种算法,通过合并多个弱学习器(决策树、神经网络、朴素贝叶斯等)来提升机器学...
1、深度学习发展史 大致经历两次浪潮:浅层学习,深度学习 Geoffrey Hinton 神经网络之父 AlexNet 2012年在ILSVRC...
自2012年,AlexNet在ImageNet图像识别一战成名后,基于深度学习的图像识别快速发展。 图像识别也是深度学习研究的主要领域。 本文解...
借助于spark的分布式特性,机器学习与spark的结合可以解决数据规模大、复杂运算时间久的问题。spark提供MLlib组件用于满足机器学习的...
“路漫漫其修远兮,吾将上下而求索”,分析之路道阻且长。就数据分析师的技能点发表一些个人想法。我把这个过程划分为三个层面(并无高低之分,只是面向不...
下文为阅读Python机器学习实践与Kaggle实战(转)一文的笔记。阅读该文解决了一些长期以来没有理清的问题,因此决定记录一下。 一、分析流程...
时间序列预测话题是比较早期接触的算法应用。 01 背景前言 时间序列分析之holtwinters和ARIMA中提到: 由于良好的统计特性,ARI...
文本处理一直是算法学习重要组成,本文对字符串的相似性,可读性做简单记录。 01 字符串相似性 评价字符串相似度最常见的办法就是:把一个字符串通过...
随机森林指的是利用多棵树对样本进行训练并预测的一种分类器 01、前言 宠物店里有猫和狗两种宠物,每个动物都有他编号、名字、交易时间、交易结果、性...
文集作者