微生物群落多样主要包括物种多样性、遗传多样性和功能多样性。在环境、能源、食品与疾病医疗等诸多领域有着广泛的研究与应用。基于16S rRNA (16S ribosomal RNA)基因的高通量测序技术克服了自然环境中大部分微生物不可培养的困难,且存在测序通量大,测序准确度高、测序价格低的优势,已经成为微生物群落多样性研究的重要基石。
由于二代测序读长限制,无法使用高通量测序技术对16S rRNA整个基因全长进行测序,因此必须针对基因的某一片段设计引物进行扩增测序。虽然有大量的文献研究不同片段的优缺点,但由于采用的样本类型、区域引物以及分析角度的不同,尚没有关于最佳可变区片段的共识。
基于大量项目经验和文献调研,16S V34(扩增长度470bp),16S V4(扩增长度300bp)为使用最多得区域。传统的认知中,普遍认为测序片段越长,测到物种数据就越多,故倾向选择16S V34。然而16S V4(515-806)引物通用性相对是所有可变区中最高的,且在大规模菌群调查研究中,如人体菌群研究HMP,地球微生物计划EMP,美国肠道计划AGP以及全球土壤菌群调查,都采用V4区作为检测区域。16S V4目前仍然是国际研究中使用最广泛和认可的检测区域。
那选择16S V34 还是16S V4扩增子区域对数据结果有哪些不同呢,我们基于分析结果来进行揭秘。
实验选取土壤(S组)、粪便(F组)、肠道内容物(G组)样本,使用同一样本DNA同时扩增16S V34,16S V4区域,采取同批扩增,建库测序和同一流程分析,并对结果中物种注释数目,属水平top30物种数目,α-多样性指数,β-多样性结果、差异物种展示、功能预测(EC)top30功能等方面进行比较,由于涉及分析内容较多,本期首先展示土壤(S组)分析结果;
第一部分:物种数目统计
第一部分:物种数目统计
土壤(S组)使用16S V4注释得到的物种数目为16S V34的2倍以上(图1)。同时,我们在结题项目中随机选取了两个扩增区域约1200个样本(不限样本类型),对其注释到的物种数目进行盒型图展示(图2),结果显示使用16S V4区域扩增注释的物种数目要也是大于16S V34的。
第二部分:属水平top30物种分布
扩增子研究主要集中在属水平物种,基于物种注释结果,实验选取每个分组在属水平上丰度排名前30物种绘制物种相对丰度柱形累加图,结果显示16S V34、16S V4 区域top30的物种基本一致,且16S V4 区域可以发现更多低丰度物种(图3)。
第三部分:α-多样性指标
Alpha Diversity用于分析样本内的微生物群落多样性,通过单样本的多样性分析可以反映样本内的微生物群落的丰富度和多样性。样本在两个区域的多样性指数趋势变化基本一致,16S V4区域的多样性数值整体高于16S V34,与注释物种数目相符(图4)。
第三部分:β-多样性指标
Beta Diversity是对不同样本的微生物群落构成进行比较分析,NMDS分析利用ASVs的丰度信息和物种进化信息,可以更好地反映生态学数据的非线性结构。根据样本中包含的物种信息,以点的形式反映在多维空间上。选择16S V34、16S V4区域并未对组间重复产生影响,同组样本仍在聚集成簇(图5)。
第四部分:差异分析-metastat
为了研究组间具有显著性差异的物种,从属水平物种丰度表出发,利用MetaStat方法对组间的物种丰度数据进行假设检验得到p值,并根据p值筛选具有组间显著性差异的物种,16S V34、16S V4两个区域的差异物种均集中在低丰度物种。
第五部分:功能预测-PICRUST2
PICRUSt2基于数据库中的ASV tree和ASV的基因信息,推断它们共同祖先的基因功能谱,最后将测序得到的菌群组成“映射”到数据库中,从而进行菌群代谢功能预测。结果显示16S V34、16S V4两个区域功能预测结果基本一致。
结果与讨论
结果
1 使用同一份土壤样本DNA同时扩增16S V34、V4两个区域,结果展示16S V4可以注释到更多的物种,主要集中在低丰度物种(相对丰度低于1%),属水平top30的物种两个区域展示基于一致;
2 多样性指标中,α-多样性指标中,样本在不同区域变化区域保持一致,β-多样性的显示,扩增16S V34、V4区域,不影响组内的重复性;
3 两个区域的metastat差异结果中,超80%的物种没有差异,存在差异物种集中在低丰度物种;
4 功能预测中EC中,功能注释top30的功能也基本保持一致;
讨论
基于测试数据,16S V34、V4结果整体差异不大,且V4要优于V34。由此,更加推荐V4区域,主要原因有:
1.16S V4(515-806)引物通用性相对是所有可变区是最高的,且在大规模菌群调查研究中,如人体菌群研究HMP,地球微生物计划EMP,美国肠道计划AGP以及全球土壤菌群调查,都采用V4区作为检测区域。16S V4目前仍然是国际研究中使用最广泛和认可的检测区域。
2.16S V4(515-806)可以检测到更多低丰度物种,有助于全面揭示微生物群落的多样性;
3.包含土壤、粪便、肠道、生物膜等类型的高分文献,也都在使用V4区域。