第一章 统计学习方法概论

1.1 统计学习

1.1.1 统计学习特点

定义:关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门科学。

学习——如果某个系统能够通过执行某个过程改进它的性能,这就是学习。

统计学习就是计算机系统通过运用统计学方法提高系统性能的机器学习。

1.1.2 统计学习对象

——数据。从数据出发,提取数据的特征,抽象出数据的模型,发现数据中的知识,又回到对数据的分析和预测中去。

统计学习的前提:同类(共同性质的)数据具备一定的统计规律。

1.1.3 统计学习的目的

统计学习的终极目标:考虑学习什么样的模型和如何学习模型,以使模型能对数据进行准确的预测与分析,同时也要考虑尽可能地提高学习效率。

1.1.4 统计学习的方法

基于数据构建统计模型从而对数据进行预测与分析(分监督、非监督、半监督和强化学习)。

假设空间:假设要学习的模型所在的函数集合。

统计学习三要素=模型+策略+算法

——假设空间+模型选择准则+模型选择算法

1.1.5 统计学习的研究(略)

1.1.6 统计学习的重要性(略)



1.2 监督学习

监督学习的任务是学习一个模型,使模型能够对任意给定的输入,对其相应的输出做出一个好的预测

1.2.1 基本概念

输入空间:输入所有可能取值的集合

输出空间:输出所有可能取值的集合

实例:具体的一个输入称为一个实例,通常由特征向量表示。

特征空间:所有特征向量存在的空间(特征空间和输入空间可以相同也可以不同,有时候需要将具体的实例从输入空间映射至特征空间)

样本点:由一对输入与输出组成

------------------------------------------------------------------------------------------------------

回归问题:输入与输出均是连续性变量

分类问题:输出是离散的

标注问题:输入与输出均是变量序列的预测问题

------------------------------------------------------------------------------------------------------

统计学习理论是基于输入与输出数据具有联合概率分布的假设,认为训练数据中的X和Y是依联合概率密度P(X,Y)独立同分布产生的。

监督学习模型:概率模型和非概率模型,由条件概率分布P(Y|X)和决策函数Y=f(X)表示。

------------------------------------------------------------------------------------------------------

1.2.2 问题的形式化(略)



1.3 统计学习三要素

方法=模型+策略+算法

1.3.1 模型

假设空间F表示。通常F是由一个参数向量决定的函数簇(决策函数型)

                                                                                         F=\left\{ f |Y=f_{\theta }(X),\theta \in R^n \right\}

参数\theta 所有的可能取值空间称为参数空间(条件概率型)。

                                                                                           F=\left\{ P |P_{\theta }(Y|X),\theta \in R^n \right\}

本书中称由决策函数表示的模型为非概率模型,由条件概率表示的模型称为概率模型。

1.3.2 策略

统计学习的目的在于从假设空间选择最优模型

------------------------------------------------------------------------------------------------------

统计函数和风险函数

损失函数(loss function):损失函数是f(X)和Y的非负实值函数,记为L(Y,f(X))

(1)0-1损失函数

L(Y,f(X))=1,Y\neq f(X) \ or\ 0,Y=f(X)

(2)平方损失函数

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 230,527评论 6 544
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 99,687评论 3 429
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 178,640评论 0 383
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 63,957评论 1 318
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 72,682评论 6 413
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 56,011评论 1 329
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 44,009评论 3 449
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 43,183评论 0 290
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 49,714评论 1 336
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 41,435评论 3 359
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 43,665评论 1 374
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 39,148评论 5 365
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 44,838评论 3 350
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 35,251评论 0 28
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 36,588评论 1 295
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 52,379评论 3 400
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 48,627评论 2 380

推荐阅读更多精彩内容