基因家族扩张与收缩分析及物种进化树构建(下)

最近刚返校,事情比较多,每天也很忙,之前写的《基因家族扩张与收缩分析及物种进化树构建(上)》也一直没来得及更新,缺少cafe输出结果的解读及后面的可视化。最近在简书上也收到了不少私信,也很高兴自己利用闲暇时间写的教程能对大家的生信分析起到略微的帮助,这也是我开通简书的初衷。我自己其实也不是生信专业出身,也是由于课题需要才接触的,从实验室的服务器环境配置、软件安装与调试,到后面接触项目,自己做分析,到现在也算是入门了吧。这一路走来,遇到的坑不少,踩的坑也挺多,也是在网上看其他人写的教程,一步步尝试,一次次解决报错,这样摸爬滚打走过来的,单纯的野路子。一方面也是受此影响,另一方面也是为了总结和整理自己的学习笔记,所以写了这些文章。由于写每一篇文章,都是用的真实数据,其中这篇《基因家族扩张与收缩分析及物种进化树构建》也是选的10个园艺果树物种的基因组外加拟南芥和水稻,从头边做分析,边写的,也是确保每一步的代码运行的稳定且可靠,而且每一步的报错也能详细的指出。其中有一步是物种进化树的构建,我采用的是iQtree做的,利用的是最大似然法构建的STAG有根树,所以运行较慢,这一步足足跑了两个星期!

最终结果如下:(Oryza_sativa:0.381481,(Diospyros_oleifera:0.269879,(Vitis_vinifera:0.190065,((Prunus_persica:0.0744669,(Malus_domestica:0.0156371,Pyrus_communis:0.0223021):1):1,((Dimocarpus_longan:0.177168,((Citrus_clementina:0.00928013,Citrus_sinensis:0.00417004):1,Citrus_grandis:0.00781403):1):1,(Arabidopsis_thaliana:0.44985,Durio_zibethinus:0.205998):1):1):1):1):1)

12-spp-STAG-tree

得到了物种进化树之后,这里用R8S提取时间树,此步参照上一篇;直接放结果:
((((((Malus_domestica:0.722166,Pyrus_communis:0.722166):28.002356,Prunus_persica:28.724522):46.395611,((((Citrus_clementina:0.154051,Citrus_sinensis:0.154051):14.174580,Citrus_grandis:14.328630):18.378373,Dimocarpus_longan:32.707003):23.254341,(Arabidopsis_thaliana:17.372300,Durio_zibethinus:17.372300):38.589044):19.158789):17.535799,Vitis_vinifera:92.655932):23.603028,Diospyros_oleifera:116.258960):35.741040,Oryza_sativa:152.000000)

有了这两个结果后就可以配置CAFE的输入文件了


cafetutorial_run.sh

接下里运行cafe,进行基因家族扩张与收缩分析:
nohup cafe cafetutorial_run.sh 2> cafe.log &

得到的cafe输出结果如下:


out.cafe
官方文档-cafe输出文件格式说明
cafe输出结果

根据官方文档介绍,物种名后下划线“_”后面的数字即为该物种在该基因家族的基因数目,那么收缩和扩张时如何来计算和判定的呢?先看第四行的结果:


cafe输出结果第四行

例如:我们想知道甜橙中基因家族扩张和收缩的情况,我们注意到甜橙所在的节点是<8>,在OG0000001中,它的基因数目是39,而与它相近的支节点为<7>,其下划线“_”对应的数字为0,如果<8> - <7> 结果是大于零的,那么针对甜橙而言,该家族就是扩张的,反之如果小于零,那么就是收缩的,如果等于零,那就是“no change”。针对此,编写脚本很容易提取相关的信息。

最后就是可视化绘图了,这里我们用“CAFE_fig”来化,cafe的输出结果可直接做输入文件:

python3 CAFE_fig.py out.cafe -pb 0.05 -pf 0.05 --dump test/ -g svg --count_all_expansions

这里的输出文件为svg格式,可直接导入到AI里进行编辑和美化。最终呈现结果如下:


12-spp-STAG-tree

以上

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,311评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,339评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,671评论 0 342
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,252评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,253评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,031评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,340评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,973评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,466评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,937评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,039评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,701评论 4 323
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,254评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,259评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,485评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,497评论 2 354
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,786评论 2 345