一、问题与数据
开展心理干预研究,招募40位受试者;研究之前,想了解这些受试者在抑郁分布方面是否具有代表性。分析:受试者的抑郁评分的均值与总体人群抑郁评分均值4.0是否存在统计学差异。收集受试者的抑郁评分。
二、对问题分析
研究者拟分析样本均值与总体均值的不同,即判断试者的抑郁评分的均值与总体人群抑郁评分均值4.0是否存在统计学差异。这种情况,我们可以使用单样本T检验,但需要先满4项假设:
- 假设1:观测变量为连续变量,如本研究中抑郁评分变量为连续变量。
- 假设2:观测值相互独立,如本研究中各位受试者的信息都是独立的,不存在相互干扰作用。
- 假设3:观测变量不存在显著的异常值
- 假设4:观测变量接近正态分布。
三、SPSS操作
- (1) 在主页面点击Analyze→Descriptive Statistics→ Explore
- (2) 将dep_score变量放入Dependent List栏
- (3) 点击Plots
- (4) 取消对Descriptive栏内 Stem-and-leaf选项的选择,并点击Normality plots with tests选项
- (5) 点击Continue, 点击Display栏的Plots选项
- (6)点击OK
一般来说,如果研究数据中存在显著的异常值,箱式图会以星号或者空心圆点的形式提示出来。如果数据值大于1.5倍箱距,数据的表示方式为空心圆点;如果数据值大于3倍箱距,数据的表示方式为星号。本研究数据中没有显著异常值,满足假设3。
假设3:不存在显著的异常值
当样本量小于50或者无法从正态Q-Q图上得出直观判断时,我们建议使用Shapiro-Wilk检验判断数据的正态分布情况。
一般来说,如果数据接近正态分布,那么Shapiro-Wilk检验的P值就大于0.05;反之如果数据并不接近正态分布,那么Shapiro-Wilk检验的P值就小于0.05。从上图可以看出,本研究数据接近于正态分布(P>0.05),满足假设4。
假设4:满足正态分布
单样本t检验的SPSS操作
- (1) 在主页面点击Analyze→Compare Means→One-Sample T Test
- (2) 将dep_score变量放入 Test Variable(s)栏,并将对比的总体均值输入Test Value栏,在本研究中输入4.0
- (3) 点击Options,
- (4) 保留95%置信区间,并保留Missing Values栏中对 Exclude cases analysis by analysis选项的选择;点击Continue→OK
四、结果解释
4.1 统计描述
在进行结果解释之前,我们需要对数据有一个基本的了解。
本研究的样本量是40(“N”栏)。这些受试者的抑郁评分均值为3.7225(“Mean”栏),标准差为0.73709(“Std. Deviation”栏)。由此可见,该研究中受试者的抑郁评分均值小于总体抑郁评分均值(4.0),但是该差别是否具有统计学意义呢?我们还需要通过单样本t检验进行深入的统计分析。
4.2 单样本t检验的结果解释
SPSS输出One-Samples Test表格:
Test Value栏提示本研究的标准均值是4.0,即我们在SPSS操作中人为输入的值。
从标注部分可以看出,受试者抑郁评分均值与总体人群抑郁评分均值的差值为-0.22750(“Mean Difference”栏),95%置信区间为-0.5132 到 -0.0418(“95% Confidence Interval of the Difference”栏)。从该表也可以看出t检验的统计结果:
从该部分可以看出,检验t值为-2.381(“t”栏),自由度为39(“df”栏),P值为0.022(“Sig.(2-tailed)”栏)。该结果提示在本研究中,受试者的抑郁评分均值与总体人群抑郁评分均值之间存在差异,即本研究受试者在抑郁分布方面的代表性不够好。本研究采用单样本t检验判断受试者抑郁评分均值与总体人群抑郁评分均值(4.0)是否有差异。研究数据不存在显著异常值,且接近正态分布。
结果显示,受试者抑郁评分为3.72 ± 0.74,与总体人群抑郁评分均值的差值为0.28(95%置信区间为0.04-0.51)。单样本t检验结果提示,t(39) = -2.381, P = 0.021,说明受试者的抑郁评分均值与总体人群抑郁评分均值之间存在显著性差异,即本研究受试者在抑郁分布方面的代表性不够好。
五、撰写结论
本研究采用单样本t检验判断受试者抑郁评分均值与总体人群抑郁评分均值(4.0)是否有差异。研究数据不存在显著异常值,且接近正态分布。
结果显示,受试者抑郁评分为3.72 ± 0.74,与总体人群抑郁评分均值的差值为0.28(95%置信区间为0.04-0.51)。单样本t检验结果提示,t(39) = -2.381, <em>P</em> = 0.021,说明受试者的抑郁评分均值与总体人群抑郁评分均值之间存在显著性差异,即本研究受试者在抑郁分布方面的代表性不够好。
六、练习数据下载
作者:解琪琪
链接://www.greatytc.com/u/bcb81276c29d
来源:简书
参考学习资源:怎么判别我的数据中存在特异值?教你几招!
SPSS教程:判断数据正态分布的超多方法!
独立样本t检验 (简洁版)
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。