【百面机器学习-模型评估】

为什么需要模型评估?

      在计算机科学特征时机器学习领域中,对模型的评估至关重要。只有选择与问题相匹配的评估方法才能快速第发现模型选择或者训练过程中出现的问题,迭代地对模型进行优化。模型评估主要分为离线评估和在线评估两个阶段。针对分类、排序、回归、序列预测等不同类型的机器学习问题,评估指标的选择也有所不同。算法工程师需要知道每种评估指标的精确定义,有针对性地选择合适的评估指标,根据评估指标的反馈进行模型调整。

【1】评估指标的局限性

(1)准确率的局限性

准确率,当不同类别的样本比例非常不均衡时占比大的类别往往成为影响准确率的最主要因素。为此,解决这个问题,可以使用更为有效的平均准确率(每个类别下的样本准确率的算术平均)作为模型评估的指标。

(2)精确率与召回率的权衡

精确率是指分类正确的正样本个数占分类器判定为正样本个数的比例。召回率是指分类正确的正样本个数占真正的正样本个数的比例。

Precision和Recall值是即矛盾又统一的两个指标,为了提高Precision值,分类器需要尽量在“更有把握”时才把样本预测为正样本,但此时往往会因为过于保守而漏掉很多“没有把握”的正样本,导致Recall值降低。针对这两个指标可以绘制PR曲线进行模型性能的对比。除此之外,F1 score和ROC曲线也能综合地反应一个排序模型的性能。F1 score是精确率和召回率的调和平均值,F1 = 2 * Precision * recall/(Precision + Recall)。

【2】ROC曲线

ROC 曲线(受试者工作特征曲线)。ROC曲线的横坐标为假阳性率(FPR),纵坐标为真阳性率(TPR)。FPR = FP / N,TPR = TP / P。P是真是的正样本的数量,N是真实的负样本的数量,TP是P个正样本中被分类器预测为正样本的个数,FP是N个负样本中被分类器预测为正样本的个数。


绘制ROC曲线

ROC曲线是通过不断移动分类器的“截断点”(预测概率阈值)来生成曲线上的一组关键点的。最终连接各个关键点。

ROC曲线下面积AUC

该值能够量化地反映基于ROC曲线衡量出的模型性能。一般情况下,AUC值越大模型性能越好。

【3】ROC曲线和PR曲线有什么特点

相比PR曲线,ROC曲线有一个特点,当正负样本的分布(或者类别不均衡)发生变化时,ROC曲线的形状基本保持不变,而PR曲线的形状一般发生较激烈变化。

【4】超参数调优

一般采用网格搜索、随机搜索。首先需要明确超参数搜索算法一般包括哪几个要素。一是目标函数,即算法需要最大化/最小化的目标;二是搜索范围,一般通过上限和下限来确定;三是算法的其他参数。

(1)网格搜索

通过查找搜索范围内的所有的点来确定最优值。如果采用较大的搜索范围以及较小的步长,网格搜索有很大概率找到全局最优值。然而,这种搜索方案十分消耗计算资源和时间,特别是需要调优的超参数比较多的时候。所以在实际应用中,网格搜索法一般会先使用较广的搜索范围和步长,来寻找全家最优值可能的位置。然后会逐渐缩小搜索范围和步长,来寻找更精确的最优值。这种操作方案可以降低所需的时间和计算量,但是由于目标函数一般是非凸的,所以很可能会错过全局最优值。

(2)随机搜索

随机搜索不再测试上界和下界之间所有值,而是在搜索范围i中随机选取样本点。理论:如果样本点集足够大,那么通过随机采样也能大概率地找到全局最优值或者近似值。随机搜索一般会比网格搜索要快一些,但是和网格搜索的快速版一样,它的结果是无法保证的。

【5】过拟合与欠拟合

过拟合是指模型对于训练数据拟合过当的情况,反映到评估指标上就是模型在训练集上的表现很好,但在测试集和新数据上的表现较差。欠拟合指的是模型在训练和预测时表现都不好的情况。

(1)降低过拟合风险的方法

1、获取更多的训练数据

2、降低模型复杂度。例如神经网络模型中减少网络层数,神经元个数等;在决策树模型中降低深度,进行剪枝等

3、正则化方法。

4、集成学习。集成学习是把多个模型集成在一起,来降低单一模型的过拟合风险。

(2)降低“欠拟合”风险的方法

1、添加新特征。当特征不足或者现有特征与样本标签的相关性不强时,模型容易出现欠拟合。

2、增加模型复杂度。使得模型具有更强的拟合能力。

3、较小正则化系数。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,185评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,445评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,684评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,564评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,681评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,874评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,025评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,761评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,217评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,545评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,694评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,351评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,988评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,778评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,007评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,427评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,580评论 2 349

推荐阅读更多精彩内容