因子分析怎么做?数据为什么要标准化?

数据分析工作,并不是直接从分析开始的,当拿到一份要分析的数据,往往需要先进行一项基础工作-数据处理。数据处理一般的操作方法,正如SPSSAU【数据处理】板块中所提供的这些处理方法。

并且上图的【生成变量】方法中包涵了多种对数据变量重新处理的方法:


其中数据的标准化处理,是在进行很多数据分析之前都需要做的:

  • 在一些分析比如主成分分析、因子分析、线性回归分析等均希望数据标准化处理。

  • 同时一些综合性评价方法还会要求更多的数据处理,比如中心化等,中心化是指:X-平均值。

  • 还有一些经管类的方法:比如中介作用、调节作用等均要求标准化。

如果不进行标准化处理,后面的分析结果可能会存在误差。

数据的标准化处理主要是为了消除指标之间的量纲和取值范围差异的影响。什么是消除指标的量纲?一般情况下,我们所收集的数据是有单位的,比如收集到一份个人信息,其中包括人的身高和体重两个指标,身高有单位cm,体重有单位kg,消除指标的量纲就是消除它们的单位,当不同指标的量级差别很大时,消除量纲是有必要的,否则,数据的分析结果可能由量级较大的指标值决定,而忽略了量级小的指标,所以消除量纲,使之全部变成没有单位的数据,便于之后的分析。

例如下面的案例,需要对我国各省市的综合发展情况做因子分析,表中有六个指标。

像这样的数据,有的指标值特别大,有的指标值特别小,比如“高校数量”和“人均GDP”这两个指标,那么在进行因子分析之前,就需要先对这六个指标变量进行数据标准化。

数据标准化的处理中,使用最广泛的一种标准化方法是z-score标准化,这篇文章分享z-score标准化的原理和做法,以及怎么进行因子分析。

一、数据的Z-score标准化

(1)Z-score标准化原理

z-score标准化是基于原始数据的均值μ和标准差σ进行的,通过下面的转换公式,就可以将原始值转换为统一的均值为0,标准差为1的数据。

z-score标准化转换公式:


新得到的标准化数据的意义是“给定数据距离均值相对来说有多少个标准差”,在均值之上的数据会得到一个正的标准化分数,在均值之下的则得到一个负的标准化分数。标准化之后数据就会全部统一起来,不会有数据非常大比如10000,而有的数据非常小比如10。如下图:

适用:z-score标准化的方法适用于一个变量的最大值和最小值未知的情况,或有超出取值范围的离群数据的情况。

(2)使用SPSSAU对数据进行标准化处理

实际的分析操作中,数据标准化处理很简单,这里以上面的案例数据来演示如何做。

1、首先打开SPSSAU网站,上传好数据如下图:

2、对6个衡量各省市的综合发展情况的指标值进行标准化处理,在SPSSAU页面右侧选择【数据处理】版块中的【生成变量】按钮。


3、接着选择Z标准化方法,选中需要标准化的6个指标,点击【确认处理】即可。


4、处理结果

SPSSAU系统自动生成新的标准化后的指标变量,原始指标值仍然存在。

此时也可以查看具体的标准化后的数值,可以看到所有的数据都被压缩到了特定区间内:

这样就完成了数据标准化处理,接下来可以用标准化后的数据做因子分析了。

二、因子分析

SPSSAU中提供现成的因子分析方法,可以快速完成,操作如下:

(1)操作步骤

在SPSSAU页面左侧选择【进阶方法】中的【因子】按钮,将标准化后的6个指标变量拖拽到页面右侧的分析框中,根据研究实际情况选择因子数量,这里选择3个,点击【开始分析】即可得出因子分析结果。


(2)输出结果
SPSSAU共输出4个结果表格,自动生成2个可视化图形,分别如下:

1、KMO和Bartlett的检验:


因子分析探索定量数据可以浓缩为几个方面(因子),每个方面(因子)和题项对应关系;

第一:分析KMO值;如果此值高于0.8,则说明非常适合进行因子分析;如果此值介于0.7~0.8之间,则说明比较适合进行因子分析;如果此值介于0.6~0.7,则说明可以进行因子分析;如果此值小于0.6,说明不适合进行因子分析;

第二:如果Bartlett检验对应p值小于0.05也说明适合进行因子分析;

第三:如果仅两个分析项,则KMO无论如何均为0.5。

2、方差解释率表格


3、旋转后因子载荷系数表格

4、成份得分系数矩阵


5、碎石图


6、载荷图

7、线性组合系数及权重结果

三、总结

总之,在做因子分析之前,一般需要先进行数据标准化处理,消除数据指标的量纲影响,数据标准化与因子分析在SPSSAU在线SPSS数据分析工具中都被傻瓜化处理,只需要点点拽拽即可完成,更方便统计入门者使用。


©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 210,978评论 6 490
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 89,954评论 2 384
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 156,623评论 0 345
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,324评论 1 282
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,390评论 5 384
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,741评论 1 289
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,892评论 3 405
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,655评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,104评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,451评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,569评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,254评论 4 328
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,834评论 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,725评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,950评论 1 264
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,260评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,446评论 2 348

推荐阅读更多精彩内容