编者按:t 检验无疑是医学论文中使用频率最高的一种统计方法,可以毫不夸张地说,95%以上的医学科学论文都会应用 t 检验对数据分析。然而在部分论文中,特别是中文杂志上刊登的论文中,滥(乱)用 t 检验的现象可谓屡见不鲜,俯拾皆是。
如何正确运用 t 检验进行数据分析,并对统计分析结果进行科学的解释的,是对一名医学科研工作者的基本要求,也是保证研究结论稳健可靠的关键所在。在此,笔者拟就医学论文中常见的滥(乱)用 t 检验的现象做一总结和概括,就如何正确使用 t 检验谈谈自己的认识。
1、不论科研设计类型而盲目套用
t 检验 t 检验有三种类型:独立样本 t 检验、配对样本 t 检验和单样本 t 检验,其中尤以前两者在医学科研中的应用最为广泛。在进行数据分析时,应根据实验设计类型选择合适的 t 检验。
若实验组和对照组未进行配对,在符合独立样本 t 检验使用条件的情况下,可采用独立样本 t 检验比较两组数据的差异是否具有统计学意义;若实验组和对照组进行配对,在符合配对样本 t 检验使用条件的情况下,则应该使用配对 t 检验。
论文写作过程中,在阐述统计学方法时,应说明自己采用的是独立样本 t 检验还是配对样本 t 检验,而不应千篇一律地将统计学处理阐述为“采用 t 检验比较两组数据”。
2、不论数据分布类型而盲目采用
t 检验 t 检验对数据有特殊的要求,独立样本 t 检验对数据的基本要求是:①数据呈正态分布;②总体方差相等。配对样本的 t 检验则要求两组数据的差值呈正态分布。对于数据正态分布检验,可以采用 Kolmogorov-Smirnov 检验或 Shapiro-Wilk 检验,这两种检验均可在 SPSS 中实现。在大多数情况下,两种检验的结果是相同的,但有时略有差异,一般以 Shapiro-Wilk 检验结果为准。
若数据呈正态分布,但方差不整齐,则可以采用近似 t 检验对数据进行分析。SPSS 软件在进行 t 检验时,会自动计算方差齐性检验的结果,并同时告知 t 检验和近似 t 检验的统计学结果。若方差整齐,则建议作者采用独立样本 t 检验的结果,反之,则宜采用近似 t 检验的结果。
大多数医学数据都不呈正态分布,如血脂、血糖、肝酶、肿瘤标志物等,因此不宜使用 t 检验进行两组数据的比较,而应该采用非参数统计方法,如 Mann-Whitney U 检验或 Wilcoxon 检验。
3、在多组设计中反复采用
t 检验比较两组之间的差异 不论是独立样本 t 检验,还是配对样本 t 检验,仅仅适用于实验分组只有两组研究。若实验设计有多个组,即同一实验因素下有多个分组,则不宜反复采用 t 检验进行反复进行组间比较。比如研究某药物对细胞增殖能力的影响,研究者设立了空白对照组(不加药物组),低剂量组和高剂量组。
需要明确药物处理是否能影响细胞的增殖能力,则不宜分别采用 t 检验分别比较高剂量组与对照组、低剂量组与对照组、高剂量组与低剂量组之间的差异是否有统计学意义,而应该采用单因素方差分析或 Kruskal-Wallis H 检验先从总体上明确三组之间的差异是否有统计学意义,然后根据研究需要决定是否进行两组间的比较,采用何种方法进行比较。
4、割裂统计学结论与专业结论的联系,试图以统计学解释代替专业解释
统计学是医学科研的重要工具之一,医学科研的开展诚然离不开统计学的支持,但是也不能完全依靠统计学。在很多情况下,有统计学意义并不意味着专业意义,反之亦然。不论是独立样本 t 检验还是配对样本 t 检验,对统计学结果的解读并不能局限于 P 值。P 值只是反映了犯Ⅰ类误差的概率,并不能反映实验效应的大小。
通俗地讲,P 值班为 0.02 的统计学含义为:实验组和对照组之间的差异可能有两种解释,即“抽样误差”和“实验因素(包含其它混杂因素)的作用结果”,而前者的概论仅为 2%。因此,我们可以认为抽样误差导致两组差异纯的可能性极小,实验组和对照组之间的差异是由实验因素造成的。
研究是否有专业价值往往能够需要考虑差异的大小,而不应该仅仅局限于一个 P 值。比如研究某药物对血糖的影响,服用药物前后,研究对象的血糖平均值分别为 9mmol/L 和 8.5mmol/L(方差略),经 t 检验发现两组的差异有统计学意义(P=0.02)。该研究虽然在统计学有意义,但这并不意味着该研究结果具有专业价值,因为从专业上来讲,如果一个药物仅仅只能将血糖降低 0.5mmol/L,其临床价值几乎可以忽略不计。
5、结语
在本文中,笔者总结了几种常见的滥(乱)用 t 检验的现象,并探讨了 t 检验的适用范围和专业解释。希望本文有助于各位同行正确认识和运用 t 检验,避免在发表研究论文时出现“滥(乱)用 t 检验”尴尬。
转载自(版权归)--胡志德,济南军区总医院检验科。Journal of Thoracic Disease 学术沙龙委员。