全基因组关联分析(GWAS)-基本分析内容

1、GWAS 流程

image.png

数据质控
• 1)按分型百分比条件过滤,多数文章剔除缺失率在20%以上的位点,样本量较大的群体中,可以将缺失率小于50%的位点都保留;
• 2)按等位基因频率过滤,通常去除第二等位基因频率小于5%的位点,样本量较大的群体中,可以降低到1%;
• 3)多等位位点的过滤(适应软件);
• 4)哈迪温伯格平衡过滤,一般无法使用较为复杂的统计模型的情况使用,如人类的 Case/Control GWAS 中一般将不符合哈迪温伯格平衡的位点过滤掉,植物GWAS中一般不过滤;
• 5)极端表型的去除。
LD 衰减分析
• 确定使用的群体的LD衰减距离,判断使用的标记代表性
• 最低饱和标记量 = 基因组大小/LD衰减距离
• 越密越好:检测到功能位点的概率增大;处于同一个Block的位点相互验证
(Manhattan plot 柱状峰值)
image.png

群体结构与亲缘关系的评估
• 群体结构和亲缘关系是导致关联结果出现假阳性的两个主要因素
• 对群体结构和亲缘关系进行评估以确定使用的统计模型和获得相应的矩阵
image.png

群体结构对GWAS结果的影响
image.png

基因型与群体结构关联
image.png

群体结构评估的内容
image.png

亲缘关系的评估内容
image.png

样本清除
• 根据群体结构和亲缘关系的评估结果对可能影响结果的样本进行去除
• 1)遗传上与绝大多少样品差异极大样品应当剔除;
• 2)亲缘关系非常近的两个材料可以只保留一个。
关联分析
• 选择正确的统计方法进行关联分析
• 1)小标记量候选基因关联分析:可以选择比较简单的t-test或者ANOVA;
• 2)Case/Control-质量性状:卡平方检验,OR检验,逻辑回归,也可以视为数
量性状使用较为复杂的线性模型;
• 3)数量性状:根据群体结构评估的情况,选用相应的模型,但在实际操作中一
般使用多种模型(GLM/MLM/EMMAX/FaST-LMM)同时分析,根据结果进
行取舍
GLM
image.png

MLM
image.png

关联分析模型与软件
image.png

选择: GLM/MLM/CMLM为基础( TASSEL/GAPIT) , 与EMMAx、 Fast-LMM相互比较, 其他作为补充,当性状与群体结构相关时, 可以考虑使用FarmCPU
显著性阈值确定
image.png

2、结果解读

曼哈顿图(Manhattan plot)
分位点-分位点图(Quantile-Quantile plot)

image.png

可喜的结果
image.png

遗憾的结果
image.png

可能原因:性状考察不准确;性状受环境影响大;该性状由多个小效应位点控制,可增加样本量提高检测效力(Power);模型的检测效力问题;标记密度不够;性状的变异是由表观修饰引起的,与基因型无关
挽救方法:提供准确的表型数据进行关联分析;多年多点重复;增加样本量;增加标记量;更换模型;忽略阈值,选择有明显的峰值区域进行验证
问题结果
image.png

后续的生物信息学分析
• 获得显著位点后,从生物信息学的角度还可以进行如下分析:
• 1)对显著位点附近进行LD Block分析,确定候选区间的范围;
• 2)对候选区间内的基因进功能注释(包括nr,GO,KEGG等);
• 3)显著位点是否位于编码区,是否引起编码氨基酸的改变;
• 4)同源分析,结合其他物种对应的同源基因的功能猜测候选基因的功能
后续实验验证
材料:举例-381份粳稻品种(热带和温带品种)
1、关于水稻谷粒大小的性状,GWAS定位到7号染色体,SNP峰值所在地方注释到11个基因;
2、对11个基因分别在稻穗、叶片和根系中做RT-PCR,只有第9个基因OsSPL13在稻穗中表达有差异;
3、OsSPL13基因蛋白表达的进一步验证;
4、分析OsSPL13基因在水稻大粒和小粒之间的序列差异,包括SNP位点和小的indel;
5、通过转基因找到影响OsSPL13基因表达相关的相关区域(5’UTR中的一个串联重复序列);
6、通过RNA干扰的方法将大粒品种GP579和小粒品种Dongjing中OsSPL13的表达量下调后会使水稻籽粒的长度和粒重都显著降低;
7、筛选到1个Dongjing来源的glw7突变体,粒长和粒重比野生型均明显降低;
8、通过chip-seq进行OsSPL13调节下游基因的验证(结果未示)SRS5和DEP1。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,470评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,393评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,577评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,176评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,189评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,155评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,041评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,903评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,319评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,539评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,703评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,417评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,013评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,664评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,818评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,711评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,601评论 2 353

推荐阅读更多精彩内容

  • 最喜欢看的电影电视剧有两种,一是高评分有内容有技巧的好片,一是全程靠着无脑对话拼凑起来的消遣片。奇怪的是,从高质量...
    兰子的字阅读 342评论 0 2
  • 对记忆力不好的人来说,找东西就像和过去的自己来一场随机性的捉迷藏游戏。 这段时间不知道是由于工作繁...
    SHE林阅读 214评论 4 2
  • 朋友找我吃饭,吃着聊着话题转到了女朋友上。 “明天教师节诶,你准备了什么礼物给你的老师女朋友呀?” 我看着他,失神...
    c5df7d4f71a4阅读 355评论 0 0
  • 今天老师讲的是I2C通讯里面的mcp23008的应用。主要还是的还是节省资源,可以最大程度的利用主芯片的管脚来实现...
    胡英杰1984阅读 161评论 0 0