多重比较校正

本文部分转载于:http://sealhuang.github.io/multiple-comparsion

主要内容来自wikipedia以及这个网页.

假设我们手上有一枚硬币,想通过抛10次硬币的方法检验它的正反面分布是否均匀,结果发现扔10次,有9次国徽朝上。此时我们打算下结论说它的分布不均匀,恐怕被人动了手脚。但这个判断的正确性有多大,在统计上就需要用 p-value 来衡量。p-value 就是在原假设(Null hypothesis)为真时,得到和试验数据一样极端(或更极端)的统计量的概率;它本质上控制假阳性率( false positive rate,FPR:第Ⅰ类错误,即实际无病或阴性,但被判为有病或阳性的百分比)。我们常说的 p 小于0.05即是说发现的现象为假阳性结果的概率小于5%。

\color{green}{FWE:整体错误校正}

如果我们手上有10000枚上文提到的相同的硬币要检验呢?假设针对每枚硬币依然采用以上的方法,则这10000次检验完全不出错的概率只有 (1 - 0.05) ** 10000。这在很多情况下不能接受的。此时我们面对的不再是 single test 问题,而是 multiple test。需要控制的是 family wise error rate (FWER)。一种很经典的控制FWER的方法是 Bonferroni correction。比如我们设定FWER为0.05,则可以将所有10000次检验中,出现错误的概率控制在5%以内。


\color{green}{ Bonferroni校正:简单的说就是用0.05除去多重比较的次数,得到一个比较低的阈限。但是这种方法往往比较苛刻,只在比较数目比较少的时候适用。}

通常情况下, 若只做一次统计检验(比较或相关等) , 一般设定检验水准 a = 0.05
即1次检验犯错误的概率为5%, 则1次检验不出错的概率为1-5% =95%
若做100次检验, 完全不出错的概率为(1-5%)^100 = 0.59%(小于1%!), 至少犯一次错的概率为1-0.59% = 99.41%(接近100%! )
如果希望犯错一次概率不超过5%, 怎么办?
              (1-a)^n >= 0.95     ((1-a)^n 当n足够大时,这个等式可以化简为1-na)
              (1-a)^n >= 1 – na, 1 – na >= 0.95
若n = 100, 计算得到a <= 0.05/100 = 0.0005
也就是说, 只有每一次检验犯错误的概率小于0.0005, 才能保证100次检验总的犯错误的概率小于5%——Bonferroni校正
VBM分析全脑约480000个体素参与统计检验, 则每次检验犯错误的概率需小于5%/480000?

但面对 fMRI 这样的数据,Bonferroni correction 则显得不太合适了。\color{red}{Bonferroni correction 是否适用,取决于数据是否服从一个基本假设:}

即每次 test 是否独立。像上面举的抛硬币的例子,每抛一次,显然都是独立事件。但像 fMRI 这样邻近 voxel 的信号往往具有高相关的数据,Bonferroni 矫正显然不太适用了。

image.png

为了针对这种情况,人们选择使用了 Random-field Theory (RFT) 进行 FWE correction。其基本假设就是空间邻近的 voxel 具有相关(也可以说是存在由空间平滑造成的相关),则在检验前,先估算数据的平滑程度,再基于这一指标计算某个 voxel 不是由随机因素引起激活的概率。这种方法相对前一种相对宽松很多,但研究发现,其假设要求平滑程度至少要为数据最小空间分辨率的2-3倍(而且平滑程度越大,检验效果越宽松),使得许多研究无法采用此方法,同时也有研究表明这种矫正方式同样过于严格。

RFT是SPM软件包的默认校正方法,当你选择“FWE correction”的时候,你采用的就是RFT校正。

\color{green}{FDR:错误发生率}

鉴于以上问题,以及对 FWE 概念的理解,随之我们采用了一种新的方法,FDR(False Discovery Rate)错误控制方法。FWE校正是为了控制N次统计比较后,随机情况下可能产生的假阳性事件。它可以确保任何假阳性出现在我们结果中的概率在5%以内,也就是在结果中几乎没有假阳性,每个显著的体素都是真正的被激活。而这与实际情况并非完全一致,因为在数据分析的过程中,每一步都会带入一些干扰而使得小部分本没有激活的体素变的显著了。也就是说,研究者实际上是可以接受结果中存在一定的假阳性,而这正是FWE校正想控制的;但研究者也都有一个信念:我们的数据是存在噪声的,我们希望知道这些显著的结果中,有多少是真的。

与FWE校正不同,FDR校正并不保证你的结果中没有假阳性,而是将假阳性的结果控制在很小的范围(如5%)。从二者的名字上,也可见差别。如果FDR校正后,你有100个体素激活了,我们可以肯定其中5个是假阳性的,但是你并不知道是哪5个。相对来说,FDR校正要比RFT校正更宽大一点,但是每个研究者必须知道他们付出的代价是,结果中有一些假阳性的体素。SPM和AFNI软件包中都有FDR校正的方法。

FDR 方法有效的控制了在这些阳性结果中的错误出现率。比如在上文中提到的10000个检验中,只发现1000个阳性结果,即硬币质量分布不均,则若控制FDR的q-value为0.05时,只对这1000个检验进行操作,并保证最后经过校正的检验结果中出现假阳性的结果的数量不多于50个(1000 * 0.05)。相对 FWE,FDR 在对结果的控制上显然要宽松很多,同时也给研究带来了更多的“有效”结果。需要提一下的是,在 FDR 校正中,对于 p-value 最小的检验,其校正的力度最大,随 p-value 增大,校正力度逐渐减小,这也体现了其减少假阳性结果的目的。


image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 210,914评论 6 490
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 89,935评论 2 383
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 156,531评论 0 345
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,309评论 1 282
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,381评论 5 384
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,730评论 1 289
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,882评论 3 404
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,643评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,095评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,448评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,566评论 1 339
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,253评论 4 328
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,829评论 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,715评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,945评论 1 264
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,248评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,440评论 2 348