宏基因组学
宏基因组学(Metagenomics)又叫微生物环境基因组学、元基因组学。它通过直接从环境样品中提取全部微生物的DNA,构建宏基因组文库,利用基因组学的研究策略研究环境样品所包含的全部微生物的遗传组成及其群落功能。它是在微生物基因组学的基础上发展起来的一种研究微生物多样性、开发新的生理活性物质(或获得新基因)的新理念和新方法。其主要含义是: 对特定环境中全部微生物的总DNA(也称宏基因组,metagenomic)进行克隆,并通过构建宏基因组文库和筛选等手段获得新的生理活性物质;或者根据rDNA数据库设计引物,通过系统学分析获得该环境中微生物的遗传多样性和分子生态学信息。
目录
起源
宏基因组 [1] 学这一概念最早是在1998年由威斯康辛大学植物病理学部门的Jo Handelsman等提出的,是源于将来自环境中基因集可以在某种程度上当成一个单个基因组研究分析的想法,而宏的英文是“meta-”,具有更高层组织结构和动态变化的含义。后来伯克利分校的研究人员Kevin Chen和Lior Pachter将宏基因组定义为“应用现代基因组学的技术直接研究自然状态下的微生物的有机群落,而不需要在实验室中分离单一的菌株”的科学。
研究对象
宏基因组学研究的对象是特定环境中的总DNA,不是某特定的微生物或其细胞中的总DNA,不需要对微生物进行分离培养和纯化,这对我们认识和利用95%以上的未培养微生物提供了一条新的途径。已有研究表明,利用宏基因组学对人体口腔微生物区系进行研究,发现了50多种新的细菌,这些未培养细菌很可能与口腔疾病有关。此外,在土壤、海洋和一些极端环境中也发现了许多新的微生物种群和新的基因或基因簇,通过克隆和筛选,获得了新的生理活性物质,包括抗生素、酶以及新的药物等。
应用
采用宏基因组技术及基因组测序等手段,来发现难培养或不可培养微生物中的天然产物以及处于“沉默”状态的天然产物。宏基因组不依赖于微生物的分离与培养,因而减少了由此带来的瓶颈问题。
随着新一代测序技术的迅猛发展,研究宏基因组的方法也已经发生了翻天覆地的变化:传统的方法是测定微生物基因组上的16S rRNA基因,这些基因的长度通常在1500个碱基左右,广泛分布于原核生物,既能提供足够的信息,而且具有相对缓慢的进化过程;其保守性与特异性并存,通过保守区和特异区来区别微生物的种属。基于这些特性,科学家们通过选择这些基因区域,方便地研究环境中物种的组成多样性,但是还不能全面分析环境中的基因功能。新一代高通量低成本测序技术的广泛应用,科学家们可以对环境中的全基因组进行测序,在获得海量的数据后,全面地分析微生物群落结构以及基因功能组成等。
短短几年来,宏基因组学的研究已经渗透到各个领域,从海洋到陆地,再到空气,从白蚁到小鼠,再到人体,从发酵工艺到生物能源,再到环境治理等。
遇到的问题
样品的提取方法还有待改进,生物信息分析依赖于样品的复杂度。
16S 测序和宏基因组测序
2008 年,人类微生物组计划 (Human Microbiome Project, HMP),全球微生物组计划(Earth Microbiome Project, EMP)及人肠道宏基因组组计划 (Metagenomes of the Human Intestinal Tract, MetaHIT) 的启动,标志着人类微生态开始进入人类健康研究的视野。
微生物在医学领域的研究,主要两方面:
1. 群体:研究和人体共生的微生物群落,探讨微生物群落和疾病及健康之间的联系(微生物多样性);
2. 个体:研究分离培养获得的人类致病菌或共生菌,探讨菌株特性、进化传播以及菌株与人体的相互作用。
根据不同研究目标,技术平台也有所不同:
1. 群体:人类微生态的扩增子测序、宏基因组测序和宏转录组测序;
2. 个体:人类致病菌及共生菌株测序的原核基因组、原核转录组及互作转录组测序技术。
今天呢,咱们以群体为对象掰一掰微生物基因组上的那些事儿...........
微生物组学研究实验设计:
1. 疾病发生对微生物的影响(研究人类疾病相关的微生物组)
实验组选取患者(轻度、中度、重度)作为样本采集的对象; 对照组选取适当数目的健康人。(如下图)
2. 疾病治疗对微生物的影响(研究人类疾病治疗相关的微生物组)
实验组样本,通常选取药物治疗(用药初期、中期、后期)的患者作为样本采集的对象;一般均设置健康对照组和未人为干预的疾病对照组。
3. 人类健康与微生物间的关系
针对身体健康的人群,旨在关注人类年龄、地域、饮食、生活方式等对人体微生态系统的影响。
微生物组学研究样品:
1. 样品种类:粪便;牙菌斑;唾液;粘膜;血液;皮肤;肺部灌洗………
2. 样品要求:
2.1 扩增子测序:DNA 总量≥150 ng; 纯度 OD260/280 在 1.8-2.0 之间;浓度≥10ng/μL,体积≥20ul 。
2.2 宏基因组测序:总量≥1.6 ug; 纯度 OD260/280 在 1.8-2.0 之间;浓度≥50ng/μL。
液氮或干冰保存寄送,本地客户可上门收样!
微生物组学研究技术(DNA 层面):
16S/18S/ITS 扩增子测序
宏基因组测序
1. 16S/18S/ITS 扩增子测序实验分析流程:
实验流程:
****分析流程:****
********
****2. 宏基因组测序实验分析流程:
**实验流程:******
********分析流程:********
****************
**********常用分析内容:
**Part1 物种注释************
**************Part2 α-多样性——指数表格**************
Alpha Diversity 用于分析样品内微生物群落多样性,通过物种累积曲线、物种多样性曲线和一系列统计学分析指数来评估各样品中微生物群落的物种丰富度和多样性的差异。(用于评估样本内物种丰富度和均一性)
Part3 β-多样性——Beta 多样性指数
Beta Diversity 是对样品间的微生物群落结构差异比较,分析方法很多。
Part4 统计分析
5.1 RDA/CCA 分析主要用来反映菌群与环境因子之间的关系。环境因子之间的夹角为锐角时表示两个环境因子之间呈正相关关系,钝角时呈负相关关系。环境因子的射线越长,说明该影响因子的影响程度越大。
5.2 共发生网络图(co-occurrence network )
5.3 与临床指标的关联分析
通过计算临床指标、环境因子等与物种、基因、功能(KO、eggNOG 等)之间的相关性(Pearson 系数等),将获得的数值矩阵通过 Heatmap 直观展示。通过颜色变化反映二维矩阵或表格中的数据信息,颜色深浅表示数据值的大小。
相比于 16S 扩增子测序,宏基因组测序除了可以获取群落结构、物种及相对丰度外,还可以获取基因功能及代谢等更深层面的信息。
**5.4 **常用功能数据库注释****
目前常用的功能数据库主要有 KEGG 通路数据库、eggNOG 功能 数据库、CAZy 酶数据库和 CARD 抗性数据库。
基因功能注释统计图
功能相对丰度柱状图
当然,还有很多分析,在这里就不一一列举啦......