生物统计学 | Fisher精确检验

最近论文吃紧,本来想搞搞群体多样性的,无奈没时间,为了保持简书上我这个号残余的一点热乎气,今天晚上分享一篇8年前写的旧文,主要讲Fisher检验的,有些不尽如意的地方稍作了一点点修改,措辞、语句、参考文献等等。

0 导语

大约是2005年冬天,高中同学再写给我的信中说他挂了一科,并且自我安慰道:“不挂科怎么是完美的大学生涯呢?”
我那个时候还暗自庆幸自己,期末考试成绩时常游走于60-70分之间,但还没挂过。
也许是注定要有一个“完美”的大学生涯。
就是第二个学期,即2006年夏天,我终于完美了一把,《生物统计学》挂了。
具体原因不再赘述,反正呢,你要是说是我笨我是肯定不同意的。
通过了那次补考之后,不禁暗自庆幸,终于啊,可恶的“生物统计学“与我,不仅仅是它走它的阳关道,我过我的独木桥,而且两者之间再也不会有任何交集,即独立且互不相容。
然而,上天很会捉弄人,时至今日,我却喜欢上了生物统计学,这其中原因说来话长,这里也不再赘述,总之一句话:”我是爱《生物统计学》的,可是我挂科了,难道非要自绝于社会不可了么?”

深夜的508,何其寂静,没有群蚊肆虐,没有酷暑难当,真想在在整上一个通宵,无奈已经没了本科时代的那种白天考研备战,晚上浸淫世界杯的那种豪情,更无奈的是明天还要上班。
虽然快11点啦,但今天还是打算分享点东西再回窝睡觉。

1 超几何分布和奶茶

首先介绍一种离散概率分布——超几何分布:有N个样本,其中m个是不合格的。超几何分布描述了在该N个样本中抽出n个,其中k个是不合格样本的概率:

 P(X=k) = \frac{C_{M}^k C_{N-M}^{n-k}}{C_{N}^n }       (0≤k≤n≤N, k≤M)

上式可如此理解:C_{N}^n 表示所有在N个样本中抽出n个的方式有多少;C_{M}^k表示在M个样本中抽出k个的方式的总数;剩下来的样本都是及格的,而及格的样本有N-m个,剩下的抽法便有C_{N-M}^{n-k}种。两者相乘就表示抽出k个是无效的有多少种抽法,而除以抽法总数即C_{N}^n 就表示抽出的n个样本中有k个不合格样本的概率P(X=k)

1935年的一个实验:伟大的Fisher得知一个女同事能够从口味分辨出下午茶的调制顺序,为了验证女同事是否在吹牛,做了一个有趣的实验:他调制了8杯茶,其中4杯先放牛奶,4杯先放茶,让女同事分辨,分辨的结果如下表:

事实上,根据小学数学知识,在已知了a=3a+b=c+d=a+c=b+d=4这两个条件以后,b,c,d和n的值也就能求出来了,所以我们只需要计算在a+b=c+d=a+c=b+d=4已发生的情况下a=3的概率(事实上选择a,b,c,d都可以得到同样的效果):

P(a=3|a+b=c+d=a+c=b+d=4)=\frac{C_{a+b}^a C_{c+d}^c}{C_{n}^{a+c}}

接著我們可進一步的算出比表格中极端情況( 在此指Fisher的同事猜得更加准确时) 的概率:

P(a = 4 | a + b = c + d = a + c = b + d = 4) = 0.014

如果全部推测对,瞎猜得到这种结果的可能是1.4%,由于此概率小于0.05,属于小概率事件,而事实是小概率事件她都猜对了,说明她不是瞎猜的。
因此我們可以再計算出P值:

P(a ≥ 3 | a + b = c + d = a + c = b + d = 4) = 0.229 + 0.014 = 0.243

女同事如果是瞎猜的,那么她瞎猜得到这种结果的概率为24.3%,这个概率依然很高,不属于小概率事件,因此无法推测女同事不是胡乱猜的。
这个跟超几何分布有什么关系呢?哎,公式都一样的,往里代就是啦!
不过区别是,超几何分布是随机地抽取,但是本例的抽取是依据女同事的判断抽取,但一件事情由随机变成了有依据,那就需要利用P值来判断这种依据的可靠性啦。

2 一个实际案例

我们看一个实际的案例:
一般大众的猜测是:大学生节食的比比男生高。因此我们设定的虚无假设为H0:大学生与男生节食的比相同,对假设为Ha:大学生节食的比比男生高。

计算P值。
P(a ≤ 1 | a+b=10,c + d =14, a + c =12, b + d = 12) =\frac{C_{10}^1 C_{14}^{11}+C_{10}^0 C_{14}^{12}}{C_{24}^{12}}

这里我不再说什么,因为P<0.01,所以大学生节食的比比男生高。

3 Fisher精确检验的基因组学应用

步入正题,涉及到基因组学的内容啦!
水稻项目统计了基因A位点变异与水稻是否易感稻瘟病的资料如下:

依上表,易感稻瘟病的样本中野生型似乎远比变异型为高,因此设定零假设为H0:基因型与稻瘟病易感性无关,备择假设为Ha:野生型更易感染稻瘟病。則我们可依上表中的资算出单边的p 值。

P(a ≤ 1 | a+b=11,c + d =13, a + c =10, b + d = 14) =\frac{C_{11}^1 C_{13}^{9}+C_{11}^0 C_{13}^{10}}{C_{24}^{10}}

因为P<0.01,即基因A位点变异是有利突变。
业务线时代的我曾经想过下面几条,
Fisher精确检验的应用如下:
1.研究基因型与基因表达的关系:如SNP与其临近的基因表达上调/下调之间的关系
2.研究基因型与表型的关联性:如变异位点与相关性状的关系检验
3.研究表型与表型的关联性:如男性手指的长度与前列腺癌发病率的关系

PS:本文言语简陋,比较粗糙,但是已尽述我的理解。
这正如上衣半截袖,下面三五七分裤,拖鞋,一身终极杀人王火云邪神的装备,并非华丽的西装革履,——一看就知这是我们信息部的弟兄们的标准配置;也正如linux系统,一切皆为丑陋的命令行,虽然比不上windows那种高帅富的图形界面,但比之丑陋的0,1似乎好看多了。
本为自用笔记,弟兄们如果喜欢,欢迎拍砖探讨。

布莱特杨
2012年5月6日 22:49

备注
2012年5月6日首发于QQ空间《我爱统计学之Fisher精确检验》
2020年5月18日 发表于e媛微生态《生物统计学 | Fisher精确检验》

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,542评论 6 504
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,822评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,912评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,449评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,500评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,370评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,193评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,074评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,505评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,722评论 3 335
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,841评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,569评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,168评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,783评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,918评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,962评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,781评论 2 354

推荐阅读更多精彩内容