评价参数估算的常用指标

​前面“回归分析中的问题和修正的探讨(下篇)”,讲到了无偏性和有效性, 这里把评价参数估计的常用指标简述下下。



基本指标

1.1 无偏性 Unbias

估算的偏差就是估计值的期望与真实值的差值。



无偏就要求估计值的期望就是真实值。



1.2 有效性 Efficiency

如果有两个估计值, 那么分布在距离真实值附近的应该效果更好。



在这种思路下,相对有效性是相对值, 估计T1和估计T2的相对有效性是平方差的期望的反比值。如果比值越大,说明T1越有效。



所以,单纯从有效性出发,最有效的,也就是最好Best的估计是均方差最小的估计。 如果是无偏估计, 那么就是方差最小了。



1.3 一致性 Consistency

就是随着样本量n增加,最后估算值会按概率收敛到真实值, 那么就是一致的估计。



所以直观上来说,就是随着样本增加, 估计距离真实值的附近的波动越来越小,直到收敛。



一致性和无偏性有一定相似的地方, 都是围绕真实值得。 但是无偏性可以一直震荡, 但不收敛, 而一致性必须收敛。  无偏性要求分布真实值两边对称, 但是无偏性只要收敛,并无对称要求。



有偏一致的估计 (红色)  VS  无偏不一致的估计(蓝色)

1.4 渐进性  Asymptote

渐近性就是现在不满足, 但是按照大数定理, 随着样本数n增长就满足了。

常见的有渐进无偏性 Asymptotic unbiasness:



当前是有偏的, 但是随着n增大, 可以证明是无偏的

渐进有效性 Asymptotic efficiency:

譬如均值估计, 方差会越来越小, 收敛到期望, 一般来说最大似然估计满足渐进有效性。





渐进正态性 Asymptotic normality:



某种意义上就是中心极限定理的表述:



鲁棒性 Robustness:

简单来说就是就算存在奇异值Outlier(参考一个奇异值的江湖 -- 经典统计观)的时候估计方法也应该适用的。

举个例子,均值Mean和中值Median的对比, 当正态分布的时候, 两者是比较一致的, 但是偏度Skewness比较大的时候, 均值和中值表现就不一样了。中值依然能把数据50%的划分, 而均值就不行了。那么, 你要想象一下,只是偏度变化就这样了, 假如有一个超级大的outlier, 那么均值肯定效果不好, 所以中值在估算平均水平的时候比较Robust。



这也是为什么, 对于有偏度的分布, 我们要尽量先进行数据变换(参考数据变换), 而对于有异常值得数据,先进性异常值检验(参考一个奇异值的江湖 -- 经典统计观一个奇异值的江湖 -- 机器学习观), 因为很多算法并不鲁棒。

再延伸一步, 这样某种意义上, 从均值发展而来的最小二乘法(详细参考一步一步走向锥规划 - 最小二乘法),也是不鲁棒的。



最小二乘法 从均值到线性(自由度增加)


最小二乘法对outlier敏感

对比之下, 而从Median加上线性思想发展起来的L-Estimator是鲁棒的。

类比之下, 从排序Ranking发展起来的R-Estimator也是鲁棒的。

延伸之下, 从最大似然Maximum Likelihood靠近的M-Estimator也相对鲁棒。



Outlier下的OLS (红) vs MLE (蓝)

另外有个伟大的算法, 叫随机抽样一致RANdom SAmple Consensus,RANSAC, 它对outlier有一套, 有兴趣大家可以详细看看, 是回归里面自带outlier检验的算法, 鲁棒性比较好。 以后有机会再展开。



组合指标

最常用的组合指标有两个一个是BLUE, Best Linear Unbias Estimiaton和MVUE,Minimum Variance Unbias Estimiation。  都是要求无偏, 并且最有效的, 区别是一个是线性的, 一个是非线性的。


举个例子, 如下图,线性的估计,就希望是BLUE的, 而非线性的估计,就希望是MVUE的。  很明显,如果是非线性的情况, 很大情况要比线性情况估算的方差要小的。



小结

我们把参数估计的常用指标大致概述了下下, 主要是BLUE和MVUE的引入。

关键词:

Unbias

Efficiency

Consistency

Asymptote

Robustness

L-Estimator

R-Estimator

M-Estimator

RANSAC

BLUE

MVUE

相关话题:

最小二乘法的6个假设 (上篇)

最小二乘法的4种求解

Z-Test vs T-Test vs F-Test vs χ2-Test

一个奇异值的江湖 -- 经典统计观

一个奇异值的江湖 -- 机器学习观

特征选择, 经典三刀

最大似然估计的2种论证

一步一步走向锥规划 - 最小二乘法

回归分析中的问题和修正的探讨(上篇)

回归分析中的问题和修正的探讨(下篇)

数据变换

Lasso简史

信息熵的由来

“66天写的逻辑回归” 引

乔丹上海行

随机眼里的临界




最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,948评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,371评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,490评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,521评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,627评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,842评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,997评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,741评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,203评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,534评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,673评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,339评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,955评论 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,770评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,000评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,394评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,562评论 2 349

推荐阅读更多精彩内容