有些变量的结果只有两种类别:如男性、女性,称为二分变量。将这些变量与一个连续变量进行相关分析时,要用点二列相关。当二分变量是人为划分时(如将成绩这个连续变量划分为:高分,低分两组),则要用二列相关(但是做二列相关时,两个数据要都满足正态分布。
点二列
点二列相关不能在SPSS中直接计算,可以利用Excel和SPSS结合进行计算。
计算公式:
r = (X1-X2)/ S * SQRT(p*q)
x1:二分称名变量的一个值对应的连续变量的平均数。例如:男生的平均成绩
x2:二分称名变量的另一个值对应的连续变量的平均数。例如:女生的平均成绩
s:连续变量的标准差 。如所有人成绩的标准差
SQRT:平方根
p:x1对应的这个二分变量所占的比例。如男生在所有人数中的比例
q:x2对应的这个二分变量所占的比例。如女生在所有人数中的比例
在excel的表格中输入各个变量,然后用以上公式进行计算,就能得到点二列相关。(注意,正负需要根据各组的平均值大小,自己进行判断)
点二列显著性检验
将上面公式中的x1与x2进行t检验(如独立样本t检验,用SPSS),若差异显著,表明r显著。如差异不显著,则说明r不显著。
如果样本容量较大(n>50),可以用下面的近似方法:
|r| > 2/SQRT(n)时,认为r在0.05水平显著
|r| > 3/SQRT(n)时,认为r在0.01水平显著
二列相关
计算公式:
r = (X1-X2)/ S * p/y
x1:二分变量的一个值对应的连续变量的平均数。例如:高分组的平均成绩
x2:二分变量的另一个值对应的连续变量的平均数。例如:低分组的平均成绩
s:连续变量的标准差 。如所有人成绩的标准差
p:x1对应的这个二分变量所占的比例。如男生在所有人数中的比例
y:标准正态曲线中p值对应的高度,查正态分布表可以知道
二列相关显著性检验
用z检验
z=r/[(1/y )*SQRT(pq/n) ]
参考资料: 张厚粲《现代心理与教育统计学》