机器学习之基本概念&深度学习介绍

一、机器学习基本概念

1. 基本概念:训练集、测试集 、特征值 、监督学习 、非监督学习 、半监督学习 、分类、 回归。

    我们先熟悉一下这些概念,在后面的例子中会一一明确。

2. 概念的学习:

    人类学习某种concept的过程:鸟、车、计算机等等(通过学习样例并进行区分学习)

    定义:概念的学习是指从有关某个bool函数的输入输出训练样例中推断出该bool函数

3. 例1:学习“享受运动”这一概念:

学习“享受运动”的数据集

从上表可以看出,小明是否享受运动取决于很多个因素,那么机器是如何根据这么多因素来学习判断小明是否享受运动呢?我们先来看一组概念:

实例(instance):表中的每一行称之为一个实例。待学习的概念定义在实例(instance)集合之上,集合表示为X(每个实例由六个属性表示,所有行的集合叫做集合X)

    - x: 每个实例

    - X: 样例,所有实例的集合

目标概念(target concept):待学习的概念或目标函数称为目标概念(target concept),记作c。

c(x)=1:享受运动,c(x)=0:不享受运动。c(x)也叫y。

训练集(training set/data)/训练样例(training examples): 用来进行训练,也就是产生模型或者算法的数据集。

测试集:(testing set/data)/测试样例(testing examples):用来专门进行测试已经学习好的模型或者算法的数据集。

特征向量:(features/feature vector):属性的集合,通常用一个向量来表示,附属于一个实例。对于每一天来说,都有六个属性,这六个值可以用一个向量来表示,称为特征向量。对于每一个实例,都有不同的特征向量。

目标标记(label):c(x)  实例类别的标记(可以理解为值(域))。

正例(positive example): 享受运动。

反例(negative example):不享受运动。

学习目标:f: X -> Y(学习函数的关系)

我们可以看出,机器通过训练集来学习每个实例的特征向量,总结出一定规律,并建立模型或者算法,而后便可通过测试集来检验模型或者算法的准确度。从这个例子来说,比如我们从100天的数据集中(包含了特征向量和label)训练模型或算法或函数(特征和label的关系),来预测10天的测试集(只有特征向量,不知道label 的值),最后结合实际来判断模型或者算法的准确度。

4. 例2:研究美国硅谷房价

    影响房价的两个重要因素:面积(平方米),学区(评分1-10)

研究硅谷房价数据集

这个例子中,实例是每一行,特征是面积和学区,目标label是房价。和第一个例子中,差别就在于标记的数据类型是不一样的,这里是连续性数值的数据,而第一个例子中的标记的数据类型是类别型。

根据这两种例子,ML中将目标标记不同的两种问题称为分类(classification)问题和回归(regression)类型。

分类(classification):目标标记为类别型数据(category)

回归(regression):目标标记为连续性数值(continuous numeric value)

5. 例3: 研究肿瘤良性、恶性与尺寸、颜色的关系

    特征值:肿瘤尺寸,颜色

    标记:良性/恶性

这个例子和之前的例子不同之处在于,我们完全不知道这些肿瘤的标记,我们只知道他们的颜色和尺寸,在这种情况下我们需要做一些聚类(以后的文章会提到)方面的工作,从颜色和尺寸上给它们大体上分类。而之前的例子中,我们是知道数据集当中的label的。

所以,从有无class label这个区别,我们可以将机器学习分为三大类:(在上篇文章提到过)

监督学习:训练集有类别标记

无监督学习:无类别标记

半监督学习:有类别标记+无类别标记

6. 机器学习的步骤框架

    6.1. 把数据拆分为训练集和测试集(110天 把100天作为训练集,把剩下10天作为测试集)。

    6.2. 用训练集和训练集的特征向量来训练算法或模型或函数来表明特征和目标label的关系。

    6.3 用学习来的算法运用在测试集上评估算法(可能要涉及到调整参数(parameter tuning),用验证集(validation set))。

二、深度学习介绍

1. 什么是深度学习?

深度学习是基于机器学习延伸出来的一个新的领域,由以人大脑结构为启发的神经网络(NN)算法为起源加之模型结构深度的增加发展,并伴随大数据计算能力的提高而产生的一系列新的算法。

神经网络举例

2. 深度学习是什么时间段发展起来的?

其概念由著名科学家Geoffrey Hinton 等人在2006年和2007年在《Sciences》等上发表的文章被提出和兴起。

3. 深度学习能用来干什么?为什么近年来引起如此广泛的关注?

深度学习,作为ML中延伸出来的一个领域,被应用在图像处理与计算机视觉、NLP以及语音识别等领域。自2006年至今,学术界和工业界合作在DL方面研究与应用在以上领域取得了突破性的进展。以ImageNet为数据库的经典图像中的物体识别竞赛为例,击败了所有传统算法,取得了前所未有的精确度。

4. 深度学习目前有那些代表性的学术机构和公司走在前沿?人才需要如何?

学校以University of Toronto、New York University、Stanford University为代表,工业界以google、facebook和百度为代表走在深度学习研究与应用的前沿。

5. 深度学习如今和未来将对我们生活造成怎样的影响?

目前我们使用的安卓手机中谷歌的语音识别、百度识图、谷歌的图片搜索都已经使用到了深度学习技术。facebook的一个deepface项目中对人脸识别的准确率(97.25%)第一次接近了人类肉眼(97.5%)。大数据时代,结合深度学习的发展在未来对我们生活的影响无法估量。保守而言,很多目前人类从事的活动都将因为深度学习和相关技术的发展被及其取代,如自动汽车驾驶,无人飞机,以及更加智能的机器人等。DL的发展让我们第一次看到并接近人工智能的终极目标。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,194评论 6 490
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,058评论 2 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 156,780评论 0 346
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,388评论 1 283
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,430评论 5 384
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,764评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,907评论 3 406
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,679评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,122评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,459评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,605评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,270评论 4 329
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,867评论 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,734评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,961评论 1 265
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,297评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,472评论 2 348

推荐阅读更多精彩内容