The Learning Problem
一、What is Machine Learning
什么是“学习”?
学习就是人类通过观察、积累经验,掌握一种技能或者能力。机器学习,顾名思义,就是让计算机也能像人类一样,通过观察大量的数据和训练,发现事物规律,获得某种分析问题、解决问题的能力。
什么是“Skill”?
Skill就是某一种表现的加强
机器学习的定义
机器学习就是从数据中总结经验,从数据中找出规律或者模型,并用它来解决实际问题。
improve some performance measure with experience computed from data
什么情况下会使用机器学习来解决问题呢?
其实,目前机器学习的应用非常广泛,基本上任何场合都能看到它的身影。对应用场景进行分类如下:
• 事物本身存在目中潜在规律
• 某些问题难以用普通编程解决
• 有大量的数据样本可以供使用
Give a computer a fish, you feed it for a day;
teach it how to fish, you feed it for a lifetime.
二、Application of Machine Learning
机器学习在我们的食、衣、住、行、教育、娱乐等各个方面都有着广发的应用,我们的生活处处都离不开机器学习。比如,打开购物网站,网站就会给我们自动推荐我们可能喜欢的商品;电影频道会根据用户的浏览记录和观影记录,向不同用户推荐他们可能喜欢的电影等等,到处都有机器学习的影子。
三、Components of Machine Learing
基本术语
• 输入x
• 输出y
• 目标函数f , 就是最接近实际样本分布的规律
• 训练样本Data
• 假设Hypothesis,一个机器学习模型对于了很多不同的hypothesis,通过演算法A,选择一个最佳的hypothesis对于的函数为G,G能更好的表现出数据的内在关系。
机器学习流程
对于理想的f函数我们是不知道的,我们手上拿到的使一些训练样本D,假设是监督学习,其中有输x,也有输入y。机器学习的过程,就是根据先验知识选择模型,该模型对应的hypothesis set(用H表示假设集合),H中包含了许多不同的hypothesis,通过演算法A,在训练样本D上进行训练,选择出一个最好的hypothesis,对应的函数表达式g就是我们最终要求的。一般情况下,g能最接近目标函数f。这样,就完成了整个流程。
四、Machine Learing and Other Fields
• 数据挖掘(Data Mining) use huge data to find a property that is interesting
• 人工智能(Artifical Intelligence)compute something that shows intelligent behavior
• 统计(Statistics)
• 机器学习 (Machine Learning) use data to compute hypothesis g that approximates target f
机器学习与这三个领域是相通的,但也是不同的。机器学习是这三个领域中的有力工具,同时这三个领域也是机器学习可以广泛运用领域。总体上说,这三个领域没有明确的界限。
五、总结
本章主要学习了什么是机器学习,机器学习的应用场景以及可以解决什么问题。然后,通过流程图的形式展示了机器学习的整个流程。
本文所应用图片来自 Coursea的《Machine Learning Foundation》课程