Phylogenetic tree——系统发育树的生成

有人说生命科学的所有问题的答案都应该到进化里寻找,还有人说不懂进化的生命科学家是耍流氓。

系统发育树或进化树是一种常用来表示物种宗谱亲缘关系的树状结构图。在分子水平,亲缘关系的远近通常用DNA(或protein)序列的差异来表示。构建发育树的算法非常多,具体参考参考文献中的文章。

一、Distance-based methods

基于距离的方法的最主要的原则是利用序列的遗传距离来构建发育树,遗传距离矩阵通常假设两个物种在进化上分离后每个核苷酸有不同的替换率,以此来推断物种的亲缘关系。这种方法的缺点就是真实的遗传距离是未知的,不管用什么方法都会引入噪音。
这种方法常用的算法有unweighted pair group method with arithmetic means(UPGMA)和Neighbor-joining(NJ)。

1、cluster analysis:UPGMA

UPGMA假设一个不随时间和物种谱系关系变化的常数替换率。(由于这个假设的局限性,这种方法已经很少使用了)。该方法首先计算两个遗传距离最小的物种(A和B)并聚类成一个新的单元(OTU)—AB,然后计算与新单元AB最小的物种,在聚类成另一个单元,这个过程一直持续下去,直达只剩两个OTU。

2、neighbor joining

这种方法非常快,所以在大型数据中使用比较广泛,也是一种非常常用的建树方法。
该算法起始于一棵总的无序的树(a totally unresolved tree),分别比较成对的序列,如果一对序列使总的树枝长度最小化,就将这对序列合成一个OTU,然后形成部分有序的树,这个过程一直继续,直到只剩三个OTU。BIONJ,FASTME,Neighbor-Net都是修改版的NJ。

二、Maximum Parsimony

最大简约原则是构建分子进化树比较流行的方法。该算法的目标是寻找到一个可以解释观察到的字符分布状态的最简约的拓扑结构。一般最简约的拓扑结构都隐含了最少的转换事件,比如核苷酸替换等,所以大多数最简约的树都可以比较准确地反应谱系关系。

三、Probabilistic Methods of Phylogenetic Inference

总的来说,该方法就是应用最大似然法来构建发育树。


the maximum likehood principle

在所有可能的树中寻找一棵能解释观察到数据的概率最大的树。

四、构建系统发育树软件集合

Functionality Title Homepage Main features Availability
Alignment ClustalW http://www.ebi.ac.uk/Tools/clustalw/index.html Outdated; GUI (ClustalX) Free binaries and source code; web service
Alignment Dialign http://dialign.gobics.de/ Accurate Source code; web service
Alignment MAFFT http://align.bmr.kyushu-u.ac.jp/mafft/software/ Fast and accurate Free binaries and source code; web service
Alignment MUSCLE http://www.drive5.com/muscle/ Fast and accurate Free binaries and source code; web service
Alignment POA http://bioinfo.mbi.ucla.edu.poa Fast and accurate Source code; web service
Tree reconstruction BEAST http://beast.bio.ed.ac.uk/ Bayesian analysis under a molecular clock Free binaries and source code
Tree reconstruction FastME http://atgc.lirmm.fr/fastme/ Very fast distance method Free binaries and source code; web service
Tree reconstruction GARLI http://www.bio.utexas.edu/faculty/antisense/garli/Garli.html Very fast ML program Free binaries and source code
Tree reconstruction IQPNNI http://www.cibiv.at/software/iqpnni/ Fast ML program Free binaries and source code
Tree reconstruction Leaphy http://www.bioinf.manchester.ac.uk/leaphy/Leaphy.htm Fast ML program Free binaries
Tree reconstruction MEGA http://www.megasoftware.net/ Distance and MP methods; GUI Free binaries (Windows only)
Tree reconstruction MrBayes http://sourceforge.net/projects/mrbayes/ Bayesian analysis Free binaries and source code
Tree reconstruction PAUP* http://paup.csit.fsu.edu/downl.html Rich set of methods; GUI for non-Intel-based Mac only Commercial license
Tree reconstruction PHYLIP http://evolution.genetics.washington.edu/phylip/getme.html Rich set of methods Free binaries and source code; some functionality as web service
Tree reconstruction PHYML http://atgc.lirmm.fr/phyml/ Fast ML program Free binaries; web service
Tree reconstruction POY http://research.amnh.org/scicomp/projects/poy.php Direct optimization of unaligned sequences Free binaries and source code
Tree reconstruction RAxML http://www.kramer.in.tum.de/exelixis/software.html Very fast ML program Free binaries and source code; web service
Tree reconstruction TNT http://www.zmuc.dk/public/phylogeny/TNT/ Very fast MP program; GUI for Windows only Commercial license and free test versions
Tree reconstruction Treefinder http://www.treefinder.org/ Fast ML program; GUI Free binaries
Network reconstruction SplitsTree http://www.splitstree.org/ Rich set of methods; GUI Free binaries
Network reconstruction T-Rex http://www.labunix.uqam.ca/~makarenv/trex.html Constructs reticulation networks; GUI Free binaries (Windows only); web service
Viewing and editing trees Dendroscope http://www-ab.informatik.uni-tuebingen.de/software/dendroscope/welcome.html Suitable for very large trees; GUI Free binaries
Viewing and editing trees FigTree http://tree.bio.ed.ac.uk/software/figtree GUI Free binaries
Viewing and editing trees Njplot http://pbil.univ-lyon1.fr/software/njplot.html GUI Free binaries and source code
Viewing and editing trees TreeView http://darwin.zoology.gla.ac.uk/~rpage/treeviewx/download.html GUI Free binaries and source code
Miscellaneous MacClade http://macclade.org/ Reconstruction of character evolution; GUI Commercial license (Mac only)
Miscellaneous Mesquite http://mesquiteproject.org/ Testing of various evolutionary hypotheses; GUI Free binaries; web service
Miscellaneous Modeltest http://darwin.uvigo.es/software/modeltest.html Determines best model in an ML framework Free binaries and source code; web service
Miscellaneous PAML http://abacus.gene.ucl.ac.uk/software/paml.html Testing of various evolutionary hypotheses Free binaries and source code

参考文献

1、https://www.sciencedirect.com/science/article/pii/B9780444521491000124

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,265评论 6 490
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,078评论 2 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 156,852评论 0 347
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,408评论 1 283
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,445评论 5 384
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,772评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,921评论 3 406
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,688评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,130评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,467评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,617评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,276评论 4 329
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,882评论 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,740评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,967评论 1 265
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,315评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,486评论 2 348

推荐阅读更多精彩内容

  • (一)分子进化的研究方法 1. 分子进化研究的意义 自20世纪中叶,随着分子生物学的不断发展,进化研究也进入了分子...
    bioinfo2011阅读 7,144评论 0 20
  • 系统发育学概念 系统发生(或种系发生、系统发育,phylogeny)是指生物形成或进化的历史。系统发生学(phyl...
    lakeseafly阅读 15,813评论 0 29
  • 所用数据为一个属内不同种不同群体的叶绿体基因组序列,数量为80条。 发现用全长序列建树的时候,不适合选用太多外类群...
    bettermaan阅读 24,320评论 5 27
  • 汕尾地区民风淳朴,汕尾人热情好客,每当客人到来,都要盛情款待,都要用汕尾的特色茶招待客人。汕尾地区相关的茶类真不少...
    七月风阅读 4,908评论 1 5
  • 快乐魏喂喂阅读 124评论 0 0