多重共线性问题相关

多元回归分析中的共线性问题

原创 2015-11-13 ccccfys spss统计分析

多重共线性:回归模型中,两个或者两个以上的自变量彼此相关时,称回归模型中存在多重共线性。

为什么多重共线性会导致一系列问题呢?试想一下,假如两个变量完全共线性,设两个变量为A,B.那么A=xB,x是常数。如果把这两个变量带入回归方程,由于一个变量完全可以用另外一个变量乘以一个常数来表示,带入两个变量,就需要给他们分配系数,怎么分配呢,显然有很多种可能,而计算机并不知道哪一种是最好的,但是在输出结果时,它会给你一种,管它是不是你想要的呢,它只关心跑完了自己的程序。现实中的共线性问题一般不会是完全共线性,但有时候共线性问题会很严重,具体有相关指标,请看下面其他内容。

多重共线性导致的问题:

1)线性关系显著(F检验显著,或者回归关系显著),大部分回归系数却不显著;

2)回归系数的符号与理论或者预期不符合。

多重共线性的识别:

1)各自变量之间显著相关(使用散点图矩阵和相关系数矩阵)

2)线性关系检验显著(F检验显著),各自变量系数却大多数不显著

3)回归系数正负号与预期相反

4)容忍度(tolerance)小于0.1或者方差扩大因子(VIF)大于10,认为存在严重共线性

多重共线性问题的处理

1)删除相关性很强的两个自变量中的一个,或者删除多个相关性很强的自变量中的几个变量;

2)提取主成分,将多个相关性很强的变量包含的信息浓缩到一个变量中;

什么时候可以不关心多重共线性问题呢?

1)模型不是用来解释现实事物之间的关系,因此不用进行系数的检验,不用考虑多重共线性问题;

2)利用回归方程在自变量样本值范围内预测因变量(注意自变量的取值只能在自变量最小值和最大值范围内)由于是进行预测,只关心结果,不考虑过程。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Chapter 9 Linear Regression 本篇是第九章,内容是回归分析(主要以线性回归为主)。回归分...
    G小调的Qing歌阅读 16,928评论 0 25
  • 多重共线性是使用线性回归算法时经常要面对的一个问题。在其他算法中,例如决策树和贝叶斯,前者的建模过程是逐步递进,每...
    JSong1122阅读 32,999评论 3 44
  • 1. 简述相关分析和回归分析的区别和联系。 回归分析和相关分析都是研究两个或两个以上变量之间关系的方法。 广义上说...
    安也也阅读 8,778评论 0 3
  • R中的线性回归函数比较简单,就是lm(),比较复杂的是对线性模型的诊断和调整。这里结合Statistical Le...
    真依然很拉风阅读 66,742评论 1 64
  • 你孤独绝望的告诉自己 没有人能帮到你 仿佛一条困在鱼缸中 来回折腾的鱼 疯狂而愤怒 执着而焦躁 却不知 鱼缸外 有...
    塵光阅读 422评论 0 1