又是一个轮到自己讲课的难过周,主题是因子分析和主成分分析,刚好可以对比二者的差别。
然后就被一个细节困住了:为什么同一个解释的总方差表可以解释因子分析的因子方差贡献率又可以解释主成分分析的主成分方差贡献率?
下面给出我的理解。
大背景:为研究全国各地区年人均收入的差异性和相似性,收集到1997年全国31个省市自治区各类经济单位包括国有经济单位、集体经济单位、联营经济单位、股份制经济单位、外商投资经济单位、港澳台经济单位和其他经济单位的年人均收入数据。即共7个变量。
数据部分展示:
知识准备:
主成分分析中的方差贡献率
是维随机向量,是个主成分,其中
主成分的贡献率:,表示某个主成分解释原始变量的能力。第一主成分的贡献率最大,表明它解释原是变量的能力最强。
因子分析中的方差贡献率
是维随机变量,为公共因子,为特殊因子,其中
因子的方差贡献率:,其中,表示:因子的方差贡献是因子载荷矩阵中第列元素的平方和。
解释:
主成分分析解释是符合常规思路的,就是方差比方差和,表‘解释的总方差’也是这样体现的。
因子分析解释在给出上述因子分析的方差贡献率公式也就清晰了。即它是成份矩阵(选择因子个数与原始变量个数一致时)每列的平方和,即对应的方差/方差贡献率。
很多时候,有些问题想着想着就很自然了。写完这个,感觉就是理所当然,纠结的原因是自己没有理顺。