5. GWAS:群体结构——Admixture

  • 群体结构是指材料的亚群分化情况,会导致标记间的非连锁关联,进而导致关联分析结果出现假阳性。

  • 地理隔离、人工选择、移民和遗传漂变等都可能导致群体分化。

  • 是指遗传变异在物种或群体中的一种非随机分布;

  • 将各材料归到每个亚群,计算每个材料基因组变异源于第K个亚群的可能性,用Q值表示,Q值越大,表明改材料来自这个亚群的可能性越大,一般可以用来推断祖先群,个体血缘组成,还有杂交事件;

  • 常用软件:Admixture、Structure、Frappe等。

随着技术的发展,Structure速度较慢,无法满足大量分子标记计算的需求,因此,admixture逐渐成为群体结构分析的主流软件。本文将介绍如何通过admixture进行群体结构计算。

1.下载及安装

1.1 下载地址

http://dalexander.github.io/admixture/index.html

1.2 安装

$ tar xvf admixture_linux-1.3.0.tar.gz
$ cd your/path/admixture_linux-1.3.0
# 调用:./admixture
# 查看帮助:./admixture --help

2. 群体结构计算

2.1 整理成admixture所需的.ped(12recode)格式

在plink中将vcf文件转换成admixture所需的.ped或.bed格式:

$ cd your/path/plink1.9
$ ./plink --vcf genotype.vcf --allow-extra-chr --recode12 --out genotype12 --autosome-num 27

--vcf 输入文件名
--allow-extra-chr 允许其他格式染色体,如scaffold
--recode12 二进制编码
--out 输出文件名
--autosome-num 设置染色体数目,默认人类染色体数

2.2 Admixture

$ cd your/path/admixture_linux-1.3.0
# 创建任务文件
$ vim adm.sh
# vim 文件名
# i 输入 左下角出现insert,可以输入
for K in 2 3 4 5 6 7 8 9 10; do ./admixture --cv root12.ped $K | tee log${K}.out; done
# ESC键 insert消失
# 退出
$ :wq

# 提交任务
$ bsub -n 4 -o log sh adm.sh
#查看任务
$ bjobs
JOBID   USER    STAT  QUEUE      FROM_HOST   EXEC_HOST   JOB_NAME   SUBMIT_TIME
913421  xxx  RUN   normal     login       4*compute11  sh adm.sh Aug 24 01:14

每个K值都会生成两个文件,.P和.Q
P:储存推断的祖先种群的等位基因频率
Q:每个样本中各个祖先种群所占的百分比。

3. 最佳分群数确定及可视化

3.1 确定最佳分群数

查看cv值,cv error最小的K值为最佳分群数。

$ grep -h CV log*.out
CV error (K=10): 0.65873
CV error (K=2): 0.71095
CV error (K=3): 0.63424
CV error (K=4): 0.68598
CV error (K=5): 0.67584
CV error (K=6): 0.66818
CV error (K=7): 0.66301
CV error (K=8): 0.66083
CV error (K=9): 0.65919

3.2 群体结构可视化

将CV结果复制粘贴至Excel中,绘制折线图。图中可看出最佳分群数为K=3。


在R中绘制群体结构图

提供几个我喜欢的配色:
K=3 "#FF4500","#9ACD32","#6495ED"
K=4 "#336666","darkred","steelblue","#CC9933"
K=5 "#FF4500","#5F7A61","#6495ED","#986D8E","#F6D167"

将K=3时的.Q文件拷贝至Windows中

> setwd("D:/数据/GWAS/群体结构")
> library("ggplot2")
> install.packages(c("ggplot2","gridExtra","label.switching","tidyr","remotes"),repos="https://cloud.r-project.org")
> remotes::install_github('royfrancis/pophelper')
> library("pophelper")
> tbl=read.table("genotype.3.Q")
> pdf("admixture.pdf",width = 9,height = 3)
> colorpal =c("#FF4500","#9ACD32","#6495ED")
> cols=rep(colorpal,700)
> barplot(t(as.matrix(tbl)), col=cols, xlab="", ylab="Ancestry",border = NA)
> dev.off()

3.3 确定样本属于哪个亚群

当确定最佳分群数是3时,打开K=3时的.Q文件,文件共包含三列,每行为一个样本,三列中哪一个数值最大,则这个样本属于哪一个亚群。

引用转载请注明出处,如有错误敬请指出。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,386评论 6 479
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,939评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,851评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,953评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,971评论 5 369
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,784评论 1 283
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,126评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,765评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,148评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,744评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,858评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,479评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,080评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,053评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,278评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,245评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,590评论 2 343

推荐阅读更多精彩内容