5-Training versus Testing

  • 以期末考试为例子,我们考试前做了大量的习题以及校对答案(training),就是为了在期末考试取得好的成绩(testing)。Ein指的是我们的成绩, Eout是我们对课程的理解, 我们希望这两者的偏差不要太大。 稍微不同的是平时的训练有M个hypothesis, 我们一直在微调,矫正我们的hypothesis, 而到了期末考试的时候我们的hypothesis已经fixed了。


    exam
  • 对错误的hypothesis, 它们是存在很大的overlapping 的, 直接相加来确定上界其实是最大的上界


    M
  • 在分类问题中。 Eout就是分界线与实际的分界线夹成的面积的大小, Ein就是统计这两个区域中的point占所有的point的占比。 并且, 稍微改动hypothesis(从蓝线到绿线), 对error的影响是比较小的, 因为也只有很少的点会落到从蓝线到绿线的变化区域(黄色)上面。


    improve
  • 之前假设输入空间是无穷的, 但是我们希望考虑有限的输入空间, 并且计算处dichotomy的数量(Hypothesis) , 它也不再是无穷的了, 而是2^N(对于二分类的情况来说)。 我们用growth function来衡量hypothesis的数量。


    dichotomy

    M

    growth
  • 在没有共线的情况下, N=3 的话所有情况都能被一根线划分, 因此是8. 在N=4的情况下, 图中阐述了一种不能被一根线划分的情况, 同样的,将蓝圈与红点置换可以得到另外一种不能被划分的情况, 所以总共是2^4 - 2 = 14.


    space
  • 接下来, 三个例子。 第一个是一维的线上, -1类在左边, +1类在右边, a可能的放置位置是N+1;第二个是在一维的线上, +1类在中间, -1类在两边,除了(N+1)选2, 还得考虑interval为空的情况; 第三个是一个凸集, 在凸集里面的点为+1, 外边的点为-1, 我们可以将+1的点两两连接,就构成了分界面, 这就意味着所有情况都是可分的, 因此是2^N。 Note: 如果H能产生所有能划分数据X的hypothesis h, 称H能打散X (X = x1, x2, x3...)。


    exp1

    exp2

    exp3
  • break point. 一个大小为k的数据集不能被H打散, k就是H的break point。事实上, 估计growth function是很困难的, 而break point提供了另外的便利。对于二维的perception, break point就是4.


    break

    examples
  • 没有break point意味着hypothesis能够拟合所有的data, 但是可能意味着generalize的能力差; 而拥有break point意味着growth function是polynomial的, Hoeffding 不等式的右边是在一个小的范围内的, 模型泛化能力好。


    result
  • Puzzle, 一个例子。x是0/1,用不同的点来表示。这个Puzzle的限制是对于其中任意的两个column的break point是2, 这意味着不能枚举完全的4中情况00, 01, 10, 11, 否则2就不是它的break point了。 所以对x1, x2, x3我们必须比较两两的column来符合这种constraint, 最终只有4个column符合。


    puzzle
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,640评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,254评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,011评论 0 355
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,755评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,774评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,610评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,352评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,257评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,717评论 1 315
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,894评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,021评论 1 350
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,735评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,354评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,936评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,054评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,224评论 3 371
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,974评论 2 355

推荐阅读更多精彩内容