看文献的时候看到了mean±SE觉得疑惑,SE真的很不常用,今天来讲讲它为什么不常用,以及其他两个(SD,CI)的含义。
用SPSS和prime分析数据画图的时候,添加error bar那里有几个选项SD(standard deviation,标准差),SE(standard error,标准误),CI(Confidence Interval,置信区间)。
这些都是可选的,然后你会发现同样的数据,SD和CI选择下的bar都比SE长,可能那个文章就是想要看起来结果好看一点,放了SE的bar在柱形图里。
但是单单有SE并不会提供很多有效信息,为什么呢?
先看三者之间的关系
SD:如果数据是正态分布的,那么95%的观察结果都会落在mean±2SD区间。它描述了观察的数据围绕均值的分布情况,数据分散则标准差大(均值为μ)。
SE:SE等于SD除以根号N,N为样本数量。这就是为什么SE比较小,因为样品数量越大,SE越小。在文章中注明SD可以反映取样的数据偏离均值的程度,但是SE是均值偏离“均值均值”的程度,给出的信息很少。
CI:可以通过SE计算,有人说SE自身不传递有效信息,主要功能是95% 或99% CI的计算。那么CI表示什么嘞,它是一种区间估计,是对一个未知参数值以区间形式给出估计。
当需要展示数据一般情况的时候(一般是表格形式,但也不限于表格),用SD比较好;当需要展示数据之间的差异或存在比较的时候(一般是柱形图,箱图等比较直观,但是也不限于图,有的时候很多数据也有的用表)用CI比较好;但是几乎不太在结果展示部分用到SE。