导语
MIMOSA:Model-based Integration of Metabolite Observations and Species Abundances,是一种对微生物是否具有产生某种代谢物的代谢潜能的一种预测和估计。
实现工具
实现该功能的工具为一个R包,名称就叫做 MIMOSA
。下面主要介绍该包的一个工作流程,软件网址为:https://github.com/borenstein-lab/MIMOSA
1 | 软件安装
rm(list=ls())
library(devtools)
# install_github("borenstein-lab/MIMOSA/mimosa")
library(mimosa)
-
将github的压缩包下载后解压得到如下文件夹和文件:
其中MIMOSA_data是下载的示例数据,网址为:https://cnoecker.github.io/TAUMicrobiomeWorkshop2019/data/MimosaData.zip,下载后解压缩便得到该文件夹,里面包含一些用于分析的示例文件。
2 | mimosa分析的主要命令
Rscript runMimosa.R --genefile="MIMOSA_data/bv_gg_picrust_genes.txt" --metfile="MIMOSA_data/bv_metabolites.txt" --contribs_file="MIMOSA_data/bv_gg_picrust_contributions.txt" --mapformula_file="MIMOSA_data/KEGG2010/reaction_mapformula.lst" --file_prefix="MIMOSA_data/mimosa_out" --ko_rxn_file="MIMOSA_data/KEGG2010/ko_reaction.list" --rxn_annots_file="MIMOSA_data/KEGG2010/reaction" --metadata_file="MIMOSA_data/bv_metadata.txt" --metadata_var="BV" --summary_doc_dir="" --num_permute=1000
- 其中
bv_gg_picrust_gene.txt
文件为16S rRNA基因测序数据通过picrust软件预测得到的KO条目,如下图所示:
-
bv_metabolites.txt
是代谢物的丰度表格,但是代谢物在这里用的是KEGG ID的编号,如下图:
-
bv_gg_picrust_contributions.txt
是每个样品中每个OTU对与之对应的KO所贡献的度,如下图所示:
mimosa_out
为结果文件的前缀,可自行根据项目类型设置-
bv_metadata.txt
样本的信息记录,如分组、性别等
其它包含在KEGG2010文件夹下的三个文件是固定的,不用更改,但是该包的作者说后面可以省去这几个文件,拭目以待。
3 | 运行
-
准备好上述文件,就可以在Rstudio的Terminal终端运行上述命令了
4 | 结果文件
- 这里主要介绍一个可视化结果,保存在
mimosa_out_summary.html
网页文件中,
打开后可以看到这么几幅图: