跟着Cell学作图|7.富集分析(Metascape数据库)
“实践是检验真理的唯一标准。”
“复现是学习R语言的最好办法。”
这篇2020年发表在cell
上关于新冠的组学文章里面有大量的生信内容。今天带大家复现其中的一个Supplemental Figure
:富集分析
。
22
本文示例数据领取:后台回复“20210430”
富集分析
基因功能富集分析,是指借助各类数据库和分析工具进行统计分析,挖掘在数据库中与我们要研究的生物学问题具有显著相关性的基因功能类别。它的统计原理是用超几何分布型来检验一组基因(共表达或差异表达)中某个功能类的显著性,通过离散分布的显著性分析、富集度分析和假阳性分析, 得出与实验目的有显著关联的、低假阳性率的及靶向性的基因功能类别。
Metascape数据库
Metascape
将40多种生物信息学知识库整合到一个单一的用户界面中。数据库更新更快,效果更好。输出结果容易理解,图表质量较高。整合了GO
、KEGG
、UniProt
和DrugBank
等多个权威的数据资源,使其不仅能完成通路富集和生物过程注释,还能做基因相关的蛋白质网络分析和涉及到的药物分析。
绘制
1. 打开数据库
2. 输入文件格式
其他格式可点击示例数据查看:
3. 粘贴基因列表或者上传基因文件
点击Submit
提交。
4.设置物种
5. 开始富集
-
可以直接点击
Express Analysis
。默认的
Express Analysis
会把许多个数据库,如Reactome、KEGG、Hallmark和GO数据库全部一起展示。 点击
custome Analysis
进行设置。
我们以GO富集
为例:
选好后,点击左上角enrichment analysis
。
分析时,基因组中的所有基因都被用作富集背景基因。默认阈值为,p< 0.01
、最小计数为3
、富集因子> 1.5
(富集因子是观察到的计数和偶然期望的计数之间的比率)的条目被收集,并根据它们的隶属关系相似性分组到集群中。
6. 结果
打开图片,可保存为PDF.
其他数据库,如KEGG
,步骤类似。
写在后面:
本系列重在复现,所以有些细节可能讲的不是很详细。大家有问题可以后台私信,或者在我的B站:
木舟笔记
进行互动!制作不易,谢谢大家多多支持!
往期内容:
跟着Cell学作图 | 2.柱状图+误差棒+散点+差异显著性检验