GWAS基本分析内容

之前给大家大致介绍了GWAS在临床生信分析中的概况，包括一些基本概念，原理和注意事项（出门左手边—>临床生物信息学中的GWAS分析），这次具体讲讲GWAS基本分析内容及结果解读（这篇也是我在百迈客云课堂的个人学习笔记，有兴趣学习的可以去购买课程百迈客GWAS生物信息培训课程）

另外参考文献及配图来自

Qiu X, Pang Y, Yuan Z, Xing D, Xu J, Dingkuhn M, et al. (2015) Genome-Wide Association Study of Grain Appearance and Milling Quality in a Worldwide Collection of Indica Rice Germplasm. PLoS ONE 10(12): e0145577. https://doi.org/10.1371/journal.pone.0145577

GWAS基本分析内容

一、基因型数据质控

1）按分型百分比过滤

一般剔除缺失率在20%以上的位点，如果数据量比较大可以放宽到50%

2）按等位基因频率过滤

去除第二等位基因频率小于5%的位点，如果数据量比较大可以放宽到1%

3）多等位位点的过滤

根据软件的需要，有些软件不支持多等位位点

4）哈迪温伯格平衡过滤

人类case/control中一般将不符合哈迪温伯格平衡的位点过滤掉，动植物不使用该过滤

5）极端表型的去除

根据MAF筛选

二、LD衰减分析（选做）

最低饱和标记量=基因组大小/LD衰减距离

密度越大越好：检测到功能位点的概率增大；处于同一block的位点相互验证

可以根据LD衰减距离来决定候选基因上下游的范围

LD decay

三、群体结构和亲缘关系

1）目的：对群体结构和亲缘关系进行评估以确定使用的统计模型和获得相应的矩阵

2）评估内容（遗传上差异过大应剔除，相似性高的保留其一）

群体结构：构建系统发育树（必备）

同一物种内序列差异不大构建NJ树(mega)，序列差异较大，不同种构建ML树(RAxML),贝叶斯树(ExaBayes)

model-base的群体结构分析

主成分分析

图片来源百迈客

亲缘关系：相似性系数热图、遗传距离

图片来源百迈客

3）群体结构和亲缘关系是导致关联结果出现假阳性的两个主要因素（课程里谢坤大牛用实例说明了群体结构和亲缘关系的选择对结果的巨大影响，比如玉米Dwarf8基因 Lessons from Dwarf8 on the Strengths and Weaknesses of Structured Association Mapping）

四、关联分析

1）选择正确的统计方法：

小标记量：简单的t-test或ANOVA

case/control质量性状：卡方检验, OR检验，逻辑回归

数量性状：一般使用多种模型（GLM/MLM/EMMAX/fast-LMM）同时分析

图片来源百迈客

2）确定显著性阈值

Bonferroni correction

3）结果解读

可视化：曼哈顿图

分位点图（随机预测出的P和实际算出来P的比较，是否异常显著）

Fig 5. Quantile-quantile plots of 16 models for GL measured in HZ. The horizontal and vertical axes are -log10 transformed expected p-values and observed p-values, respectively. Model with more uniformly distributed p-values is better.

4）若结果不显著：

可能原因及解决办法：

性状考察不准确——提供准确表型

性状受环境影响大——多年多点重复

性状由多个小效应位点控制——增加样本量

模型检测效力power不够——更换合适的模型

标记密度不够——更加标记量

实在不行就忽略阈值，选择有明显的峰值区域进行验证

五、后续生信分析

获得显著位点后：

1）进行LD block分析，确定候选区间的范围

2）对候选区间内的基因做功能注释（nr,GO,KEGG等）

3）显著位点是否位于编码区，是否是非同义突变

4）同源分析，结合其他物种对应的同源基因的功能来猜测候选基因的功能

六、实验验证

RT-PCR、蛋白表达、转基因功能验证、RNA干扰

高分文章实例：OsSPL13 controls grain size in cultivated rice

最后编辑于：2018.01.21 13:00:29

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 230,048评论 6赞 542
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 99,414评论 3赞 429
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 178,169评论 0赞 383
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 63,722评论 1赞 317
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 72,465评论 6赞 412
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 55,823评论 1赞 328
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 43,813评论 3赞 446
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 43,000评论 0赞 290
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 49,554评论 1赞 335
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 41,295评论 3赞 358
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 43,513评论 1赞 374
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 39,035评论 5赞 363
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 44,722评论 3赞 348
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 35,125评论 0赞 28
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 36,430评论 1赞 295
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 52,237评论 3赞 398
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 48,482评论 2赞 379

GWAS基本分析内容

一、基因型数据质控

二、LD衰减分析（选做）

三、群体结构和亲缘关系

四、关联分析

五、后续生信分析

六、实验验证

推荐阅读更多精彩内容