登录注册写文章

西瓜书学习笔记-绪论

西瓜书学习笔记-绪论

绪论

人类通过经验做出一些判断，在计算机系统中，经验一般以数据的形式存在。因此，机器学习所研究的主要内容是从数据中产生“模型”的算法，即学习算法。

从数据中学的模型的过程叫做学习或者训练，所学得的模型对应了数据的某种潜在规律。

1 基本概念

学习类型
我们所预测的结果是离散值，则这类学习任务称为分类。
若预测的结果是连续值，则称为回归。
根据训练数据是否有标记可分为：
监督学习（有标记），代表是分类，回归。
无监督学习（无标记），代表是聚类。

学习的目标是使得所学得的模型很好的适用于新样本，适应新样本的能力我们称为泛化能力。

假设空间：
假定有属性A、B、C，各自的取值有2种、3种、3种，则假设空间大小计算方式为：
3 * 4 * 4 + 1
因为取值中除了特定的值还包含通配符*，也就是说该数据取值任意。同时包括一个“空”。
通过训练集数据对假设空间进行缩减，得到的称为版本空间。
归纳偏好：
归纳偏好可以看作是学习算法自身在一个庞大假设空间中对假设进行选择的启发式，如何没有归纳偏好，学习算法会被假设空间的等效假设所迷惑。

奥卡姆剃刀：若多个假设与观察一直，选择最简单的。

NFL定理
证明过程

NFL定理：对于学习算法A，如果它在某些问题上表现的优于B，那么肯定在另一些问题上不如B

NFL定理说明：脱离了应用背景，讨论算法的优劣都是毫无意义的。

最后编辑于：2018.04.25 13:13:52

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

一起来读西瓜书：第一章绪论
1. 章节主要内容这一章是绪论，顾名思义就是对本书的总体介绍，并引出机器学习的概念。根据我们定下的阅读目的，我们...
闪电随笔阅读 4,027评论 1赞 17
《机器学习（周志华）》学习笔记（一）
Q：什么是机器学习？机器学习最初被定义为“不显式编程地赋予计算机能力的研究领域”。很明显，这里的“机器”是指计算...
红色的Ricky阅读 21,949评论 32赞 55
西瓜书菜鸟学习笔记绪论
引言机器学习研究的主要内容是关于在计算机上从数据中产生“模型”（model）的算法，即学习算法（learning...
奋进的小毛驴阅读 476评论 0赞 0
人生大悟
一个人太强势，不管出发点是不是好的，定会受到伤害，这种伤害几乎无法挽回，所以很多人遍体鳞伤，因为不懂得示弱。示弱其...
雪蓉阅读 596评论 0赞 0
2017-06-09
尔索马阅读 110评论 0赞 0

赞1赞

赞赏

手机看全文