6. 你的开发集和测试集应该来自同样的分布(machine learning yearning)

基于你的市场,你将包含猫的图片数据分为四个区域:(i)美国,(ii) 中国,(iii)印度和(iv) 其它。要找到一个开发集和一个测试集,我们可以随机分配两个区域到开发集,另两个到测试集,对吗?比如说美国和印度分配到开发集;中国和其它分配到测试集。

一旦你定义了开发集和测试集,你的团队会关注于提高开发集的表现性能。所以,开发集应该可以反映你希望提高性能的任务:要在所有的四个地区都表现得很好,而不仅仅是两个。

开发集和测试集有不同的分布带来的第二个问题:有可能你的团队建立的算法在开发集上表现得非常好,但是在测试集上表现得很差。我在遭遇很多挫折和浪费很多努力的情景下见过这样的结果。避免这样的事情发生在你身上。

假设你的团队开发的系统在开发集上表现很好,但是在测试集上表现得不好。如果开发集和测试集的分布一致,则你会清楚地知道这是由于过拟合开发集导致的。最显而易见的办法是获取更多的开发集数据。

如果开发集和测试集来自不同的分布,则你的选择就没有那么清楚。可能是由以下几个问题导致的:

  1. 过拟合开发集;
  2. 测试集比开发集更难识别。所以你的算法可能已经做得和预期一样很好,也没有可能进一步显著得改进;
  3. 测试集不一定更难识别,但是和开发集(的分布)不同。所以在开发集表现很好,不一定在测试集上表现很好。在这种情况下,提高开发集性能的工作可能都是一种浪费;

开发机器学习的应用已经很困难了。开发集和测试集之间的不匹配会为提高开发集性能的同时是否可以提高测试集性能带来额外的不确定。这会为找到什么是work的什么是不work带来难度,所以更难以制定选择的优先级顺序。

如果你在第三方benchmark问题上工作,他们的创造者可能已经有指定的来自不同分布的开发集和测试集。与来源于相同分布的开发集和测试集相比,运气而不是技能,在这样的benchmark对性能产生更大的影响。开发在一个分布上训练并能在其它分布上泛化地很好的算法是一个很重要的研究。但是如果你的目标是在特定的机器学习应用上而不是研究上获得进展,我建议选择来源于相同分布的开发集和测试集。这会让你的团队更有效。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,012评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,628评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,653评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,485评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,574评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,590评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,596评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,340评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,794评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,102评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,276评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,940评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,583评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,201评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,441评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,173评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,136评论 2 352

推荐阅读更多精彩内容

  • Andrew Ng目录 为什么需要机器学习策略 如何使用这本书来帮助你的团队 预备知识和符号约定 规模促进了机器学...
    Jakai阅读 3,454评论 1 0
  • 文章来自:http://blog.csdn.net/mj813/article/details/52451355 ...
    好大一只鹏阅读 9,190评论 2 126
  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 172,009评论 25 707
  • 1.问:你在测试中发现了一个 bug ,但是开发经理认为这不是一个 bug ,你应该怎样解决。 首先,将问题提...
    qianyewhy阅读 9,251评论 4 123
  • 真好!她们都是小孩子,真希望能跟她们一起,充满活力与朝气!
    宁静的流星阅读 135评论 0 0