A practical guide to amplicon and metagenomic analysis of microbiome data
第一作者:Yong-Xin Liu
时间:2021 May
发表期刊:Protein Cell
pubmed: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8106563/
期刊版: https://academic.oup.com/proteincell/article/12/5/315/6724529
摘要
高通量测序 (HTS) 的进步促进了微生物组研究领域的快速发展,现在正在生成大量微生物组数据集。然而,软件工具的多样性和分析流水线的复杂性使得这一领域难以进入。在这里,我们系统地总结了微生物组方法的优点和局限性。然后,我们推荐用于扩增子和宏基因组分析的特定流程,并描述常用的软件和数据库,以帮助研究人员选择合适的工具。此外,我们介绍了适用于微生物组分析的统计和可视化方法,包括 alpha 和 beta 多样性、分类组成、差异比较、相关性、网络、机器学习、进化、来源追踪、和常见的可视化样式,以帮助研究人员做出明智的选择。最后,介绍了分步可重现的分析指南。我们希望这篇综述能够让研究人员更有效地进行数据分析,并快速选择合适的工具,以高效地挖掘数据背后的生物学意义。
图1 用于微生物组研究的 HTS 方法的优点和局限性。(A) HTS方法的简介,用于不同级别的分析。在分子水平上,微生物组研究分为三种类型:微生物、DNA 和 mRNA。相应的研究技术包括培养组、扩增子、宏基因组、元病毒组和宏转录组分析。(B) 微生物组分析的各种 HTS 方法的优点和局限性。
图2 扩增子 (A) 和宏基因组 (B) 测序常用方法的工作流程。蓝色、橙色和绿色块分别代表输入、中间和输出文件。箭头旁边的文本代表方法,常用软件显示在括号中。分类表和功能表统称为特征表。请见 Table 1有关此图中所列软件的更多信息。
图3 特征表的统计和可视化方法概述。微生物组特征表的下游分析,包括alpha/beta多样性(A/B)、分类组成(C)、差异比较(D)、相关性分析(E)、网络分析(F)、机器学习的分类(G)和系统发育树 (H)。更多细节请见 Table 2。
alpha/beta多样性:α多样性主要体现样本内物种多少、丰度和/或均匀度,而β多样性指样本间多样性异同。(参考:https://blog.csdn.net/woodcorpse/article/details/106552561)