评价参数估算的常用指标

前面“回归分析中的问题和修正的探讨（下篇）”，讲到了无偏性和有效性，这里把评价参数估计的常用指标简述下下。

基本指标

1.1 无偏性 Unbias

估算的偏差就是估计值的期望与真实值的差值。

无偏就要求估计值的期望就是真实值。

1.2 有效性 Efficiency

如果有两个估计值，那么分布在距离真实值附近的应该效果更好。

在这种思路下，相对有效性是相对值，估计T1和估计T2的相对有效性是平方差的期望的反比值。如果比值越大，说明T1越有效。

所以，单纯从有效性出发，最有效的，也就是最好Best的估计是均方差最小的估计。如果是无偏估计，那么就是方差最小了。

1.3 一致性 Consistency

就是随着样本量n增加，最后估算值会按概率收敛到真实值，那么就是一致的估计。

所以直观上来说，就是随着样本增加，估计距离真实值的附近的波动越来越小，直到收敛。

一致性和无偏性有一定相似的地方，都是围绕真实值得。但是无偏性可以一直震荡，但不收敛，而一致性必须收敛。无偏性要求分布真实值两边对称，但是无偏性只要收敛，并无对称要求。

有偏一致的估计（红色） VS 无偏不一致的估计（蓝色）

1.4 渐进性 Asymptote

渐近性就是现在不满足，但是按照大数定理，随着样本数n增长就满足了。

常见的有渐进无偏性 Asymptotic unbiasness：

当前是有偏的，但是随着n增大，可以证明是无偏的

渐进有效性 Asymptotic efficiency：

譬如均值估计，方差会越来越小，收敛到期望，一般来说最大似然估计满足渐进有效性。

渐进正态性 Asymptotic normality：

某种意义上就是中心极限定理的表述：

鲁棒性 Robustness：

简单来说就是就算存在奇异值Outlier（参考一个奇异值的江湖 -- 经典统计观）的时候估计方法也应该适用的。

举个例子，均值Mean和中值Median的对比，当正态分布的时候，两者是比较一致的，但是偏度Skewness比较大的时候，均值和中值表现就不一样了。中值依然能把数据50%的划分，而均值就不行了。那么，你要想象一下，只是偏度变化就这样了，假如有一个超级大的outlier，那么均值肯定效果不好，所以中值在估算平均水平的时候比较Robust。

这也是为什么，对于有偏度的分布，我们要尽量先进行数据变换（参考数据变换），而对于有异常值得数据，先进性异常值检验（参考一个奇异值的江湖 -- 经典统计观，一个奇异值的江湖 -- 机器学习观），因为很多算法并不鲁棒。

再延伸一步，这样某种意义上，从均值发展而来的最小二乘法（详细参考一步一步走向锥规划 - 最小二乘法），也是不鲁棒的。

最小二乘法从均值到线性（自由度增加）

最小二乘法对outlier敏感

对比之下，而从Median加上线性思想发展起来的L-Estimator是鲁棒的。

类比之下，从排序Ranking发展起来的R-Estimator也是鲁棒的。

延伸之下，从最大似然Maximum Likelihood靠近的M-Estimator也相对鲁棒。

Outlier下的OLS （红） vs MLE （蓝）

另外有个伟大的算法，叫随机抽样一致RANdom SAmple Consensus,RANSAC，它对outlier有一套，有兴趣大家可以详细看看，是回归里面自带outlier检验的算法，鲁棒性比较好。以后有机会再展开。

组合指标

最常用的组合指标有两个一个是BLUE， Best Linear Unbias Estimiaton和MVUE,Minimum Variance Unbias Estimiation。都是要求无偏，并且最有效的，区别是一个是线性的，一个是非线性的。

举个例子，如下图，线性的估计，就希望是BLUE的，而非线性的估计，就希望是MVUE的。很明显，如果是非线性的情况，很大情况要比线性情况估算的方差要小的。

小结

我们把参数估计的常用指标大致概述了下下，主要是BLUE和MVUE的引入。

关键词：

Unbias

Efficiency

Consistency

Asymptote

Robustness

L-Estimator

R-Estimator

M-Estimator

RANSAC

BLUE

MVUE

相关话题：

最小二乘法的6个假设 (上篇)

最小二乘法的4种求解

Z-Test vs T-Test vs F-Test vs χ2-Test

最后编辑于：2017.12.11 07:09:05

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 211,948评论 6赞 492
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 90,371评论 3赞 385
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 157,490评论 0赞 348
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 56,521评论 1赞 284
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 65,627评论 6赞 386
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,842评论 1赞 290
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,997评论 3赞 408
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,741评论 0赞 268
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,203评论 1赞 303
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,534评论 2赞 327
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,673评论 1赞 341
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,339评论 4赞 330
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,955评论 3赞 313
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,770评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,000评论 1赞 266
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 46,394评论 2赞 360
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 43,562评论 2赞 349

评价参数估算的常用指标

推荐阅读更多精彩内容