《微生物非核糖体多肽的合成基因簇挖掘及其合成研究进展》

摘要:非核糖体多肽因其独特的生物活性受到关注,它结构复杂、种类繁多。许多微生物能利用非核糖体肽合成酶(nonribosomal peptide synthase,NRPSs)合成这些非核糖体多肽。NRPSs是一类分子巨大的蛋白复合物,由一系列催化结构域组成,能识别、激活、转运氨基酸底物并按特定顺序合成非核糖体肽(non-ribosomal peptide,NRPs)。其模块化结构涉及的基因在基因组上成簇排列。基于基因组挖掘技术可以预测基因组上的次级代谢产物合成基因簇,并发现新的次级代谢产物。针对非核糖体多肽的生物合成基因簇的分布、挖掘、模块化结构以及合成等方面的研究进行分析,有望为理解非核糖体肽合成酶系统合成生物活性物质的机制和挖掘新型生物活性物质提供依据。

关键词:非核糖体多肽;非核糖体肽合成酶;基因簇;生物合成

非核糖体多肽(non-ribosomal polypeptides,NRPs)是构成重要的生物活性天然产物家族的代表,例如环孢菌素、达托霉素,博来霉素和万古霉素等是细菌和霉菌产生的重要次级代谢产物,其相应的化学结构如图1所示。作为抗生素、免疫抑制剂,有抗菌,杀虫,抗胆固醇和抗癌活性,此外还有色素、杆菌肽、细菌素、毒素等均属于非核糖体多肽(表1)。NRPs结构多样,合成过程复杂。各种NRPs的组成并不局限于20种常规氨基酸,还包括一些非天然氨基酸、脂肪酸和α-羟酸等,有些NRPs还具有独特的环状、分枝状结构,或被糖链,脂肪链修饰,形成了结构的多样性,也导致其生物活性和药理活性也非常多样。


图1 几种非核糖体多肽的化学结构


                                                                        a:环孢菌素;b:达托霉素;c:博来霉素;d:万古霉素


表1 已报道的微生物非核糖体多肽来源及特性

非核糖体多肽在细胞内的合成不同于常规蛋白质和多肽的合成,它不需要核糖体为翻译场所,也不需要信使mRNA为模板,不需tRNA为携带工具,可以利用一些稀有氨基酸或脂肪酸,需要多酶或多结构域的合成系统共同参与完成,因此被称为非核糖体合成肽。其中,起关键作用就是非核糖体肽合成酶(non-ribosomal peptide synthetases,NRPSs)。NRPSs是一类分子巨大的复合物,由多个模块(module)构成,每个模块负责催化一个反应循环,包括对底物的选择性识别,并将其腺苷酸化、共价中间物的固定和肽键的形成。通常合成NRPs的模块在基因组上成簇排列,比如来自地衣芽孢杆菌的杆菌肽bacitracin A,是由5个模块构成的NRPSs复合物协同催化完成的[1]。

非核糖体多肽合成基因簇的发现不仅为阐明活性多肽的生物合成机制奠定基础,同时也为体外改造和合成这些活性多肽提供遗传信息。近几年运用合成生物学的技术对NRPs进行修饰改造,合成新型的化合物取得了不菲的成效[10],但前提是要对NRPs的生物合成过程要深入了解,其中挖掘和明确NRPs的基因决定簇是关键。

随着基因组测序技术的广泛应用,越来越多的生物基因组信息被解码,公共数据库中可用的基因组数量迅速增加,而且各种软件包(包括C1ustScan[11],2metDB[12],SMURF[13],antiSMASH[14]和ClusterFinder[15])和数据库(NCBI、PDB、SWISS-PROT库)也已开发并可以应用于计算机识别结合分析NRPSs基因簇。因此,通过生物信息学的分析在未描述的谱系生物中发现NRPSs的分布以及基因簇结构,并指导挖掘新的活性天然产物成为可能。本文将利用在线数据库和生物信息学软件,并结合相关的研究文献报道,对非核糖体多肽的生物合成基因簇的分布、挖掘、模块化结构以及催化机制进行分析,有望为理解非核糖体肽合成酶系统合成生物活性物质的机制和挖掘新型生物活性物质提供依据。

1 NRPSs基因簇的分布

以“non-ribosomal peptide synthetases”为关键词在Genbank中进行查阅,共发现177210条编码非核糖体肽合成酶NRPSs的序列,包括动物、植物、真菌、原生生物、细菌和古生菌6种不同来源。其中,动物中编码非核糖体肽合成酶的氨基酸序列数量为851条,植物为398条,真菌具有8777条,原生生物存在185条,细菌最多,含有165929条,古生菌为25条。可见,NRPSs主要分布在微生物的细菌和真菌中,这也正说明了微生物是非核糖体多肽的主要来源。

从数据库中公布的NRPSs的序列中选取典型代表纲类或代表门类,构建基于来自选定生物体的16S或18S rRNA基因的系统发育树(图2),表明了模块化的NRPSs基因簇广泛分布于生命的3个域中。具体来说,NRPSs基因簇大量存在于细菌中的变形细菌、放线菌、厚壁菌门、蓝藻细菌以及真菌中的子囊菌门的系统发育谱系中,其中包含已发现的绝大多数生物合成途径。特别是细菌目的黏球菌,芽孢杆菌目的枯草芽孢杆菌和地衣芽孢杆菌,放线菌目的诺卡菌和伯克菌,真菌纲的粪壳菌,散囊菌和座囊菌均产生很丰富的非核糖体肽天然产物。事实上,越来越多的证据都支持此种模式,已从上述谱系的新测序属中鉴定出新的NRPSs基因簇。例如,细菌的放线菌中的盐孢菌属[16]和诺卡菌[17],厚壁菌属中的梭状芽孢杆菌[18],以及真菌中的鼠疫菌属[19],频繁出现NRPSs生物合成途径。


图2 NRPSs在“生命三域”中的分布

带有I型PKS或NRPSs酶的分类单元分支用粉红色标记,另外红色标记的是同时含有PKS和NRPSs酶或杂交PKS-NRPSs酶的谱系,紫色标记的是仅包含NRPSs酶的谱系

2 非核糖体多肽合成基因簇的挖掘

早期研究非核糖体多肽的生物合成基因簇的方法是先进行表型筛选,明确多肽的生物活性,然后利用杂交法、突变株回补法、染色体步移法等技术克隆基因簇,即由表型到基因型。迄今为止已经克隆了超过150种微生物次级代谢产物的生物合成基因簇,其中多肽类、糖肽、脂肽类和β-内酰胺类等都主要由NRPSs负责合成[20]。这种方法耗时长,只能发现有限的基因簇,而且容易出现同类活性肽的结果。而通过基因组比较和信息挖掘,可以直接发现新的次生代谢产物的合成基因簇,并在生物遗传学指导下,利用“生物合成基因—合成酶—天然产物”机制合成目标产物,这种从基因型到表型的方式成为挖掘新型活性肽的捷径,尤其是在聚酮合酶(PKS)和非核糖体肽合成酶领域,成果丰硕[21]。

2.1 基因组挖掘及NRPSs基因簇的预测

截止到2019年11月,在NCBI数据库中注册的微生物基因组有48619条,其中许多微生物基因组中均含有多个次级代谢产物的生物合成基因簇,比如模式放线菌天蓝色链霉菌(Streptomyces coelicolor)的基因组中含有29个次级代谢产物生物合成基因簇[22],其中包含5个NRPSs或NRPSs-Like的基因簇(图3-A显示其中一个NRPSs基因簇)。利用Blast对来自NCBI数据库的所有基因簇进行Blast比较分析,找到相似性较高的同源基因簇(图3-B);基于假定的PKS/NRPSs共线性原则粗略预测该基因簇的NRPSs-A结构域的产物,如果不考虑末端修饰,那推断的多聚物为:(ser-thr-D-trp-asp-asp-D-hpg)+(asp-gly-D-asn)+(3-meglu-trp)。在这29个基因簇中,只有其中部分基因簇的表达产物得到分离和应用。因此充分挖掘基因簇信息,有助于发现新的生物活性产物。


图3 Streptomyces coelicolor基因组中的一个NRPSs基因簇及相似的已知基因簇

标注:A,one of the NRPSs gene cluster;B,similar known gene clustersantiSMASH(antibiotics and secondary metabolite analysis shell,https://antismash.secondarymetabolites.org),是一款分析抗生素和次级代谢产物合成基因簇的强大工具。它是通过加载完整的基因组序列或靶基因组的登录号来分析非核糖体合成的化合物[23]。房耀维等[24]利用基因组发掘技术和antiSMASH方法,从海洋稀有放线菌Salinispora arenicola CNP193基因组序列中发掘3个新颖PKS和NRPSs基因簇,并初步预测基因簇对应产物为烯二炔类和有半胱氨酸及其他氨基酸参与合成的肽类化合物。Jong等[25]通过antiSMASH 3.0预测了部分Brevibacillus laterosporus菌株的生物合成基因簇,并且根据与已知簇相似的基因发现了23种抗菌物质。此软件已更新到antiSMASH 5.0版本,改进版本提高了分析性能,其准确性和效率的不断提高将对天然活性产物的发现十分有益[14],因此一些高级次生代谢产物被发现,同时也发现了未表征的生物合成途径。

除了采用上述在线软件进行NRPSs基因簇挖掘和预测,近年来也在不断地开发出多种基因组挖掘方法,比如,比较基因组学、基因组同位素标记、基因编辑、异源表达、组学分析技术等。比较基因组挖掘可以对单个基因或整个基因簇的功能进行分析比较,再结合各种数据库信息,能够有效的发现新天然产物。Ziemert等[26]利用比较基因组学分析了微生物次生代谢产物合成基因簇的系统进化,通过序列相似性比较准确挖掘出新的功能基因和基因簇。Zhang等[27]利用CRISPR-Cas9策略对变色链霉菌基因组进行编辑,发现了II型五角形聚酮化合物。随着基因组测序技术的升级,单细胞基因组和宏基因组测序也为揭示更多潜在的、隐匿的功能基因簇提供了有效的手段[28],近来,Wilson等[29]利用宏基因组测序和海绵微生物组的单细胞基因组学相结合,揭示了一种在海绵中广泛分布的全新候选门类“Tectomicrobia”。因此,通过有效的分析工具和算法对遗传大数据进行分析,并联合新的基因组挖掘技术,可以加深了解和发现新型天然产物。

2.2 NRPSs基因簇结构特征

基于antiSMASH的分析结果,几种具有生物活性的次级代谢产物的NRPSs基因簇结构如图4所示,可以发现基本呈模块化结构,但模块数量和结构有较大差异。


图4 不同NRPSs生物合成途径中所需NRPSs的模块结构

Bogorol是具有抗耐甲氧西林金黄色葡萄球菌和抗万古霉素肠球菌的强效抗生素[30],是由含有高度模块化组织的巨大NRPSs基因簇合成的,共有14个模块组成,其中每个模块又是3个核心域的最小集合,即A结构域、PCP结构域和C结构域。赤霉病链霉菌(Streptomycesscabies thaxtomin A)的生物合成除了3个核心结构域之外,还有nMT域的参与;作为许多药用植物的药用成分,具有生物活性多样性的吲哚生物碱(brevianamide)FtmA只有1个模块,由A结构域、PCP结构域和TD结构域的作用下合成的;surfactin是由β-羟基脂肪酸和7个氨基酸组成的环状脂肽组成的典型的脂肽表面活性剂,由7个模块组成,是3个核心结构域和TE结构域、E结构域的共同作用下进行生物合成的[31];强效的抗肿瘤化合物雷拉霉素(leinamycin)是tran-AT杂合PKS/NRPSs基因簇的产物,在该杂合基因簇中,对于缺乏AT结构域的PKS模块,单体通过离散的AT蛋白LnmG在trans中重复加载[32]。

从这几类NRPSs基因簇结构发现,典型的NRPSs模块含有3个重要的核心结构域,分别为腺苷酰化结构域(A或AT)、肽酰基载体蛋白结构域(PCP)也叫硫醇化结构域(T)和缩合结构域(C结构域),分别负责氨基酸的活化、酰胺键的形成以及肽链的释放。这是基本结构或最简单的结构,而其他的修饰模块还有终止结构域—硫酯酶结构域(thioesterases domain,TE)、甲基转移酶结构域(transmethylase domain,MT)、差向异构结构域(epimerization domain,E)、酰基转移酶结构域(acyltransferase domain)、甲基化结构域(methylation domain,M)、环化结构域(cylization domain,Cy)、氧化结构域(oxidation domain)等[33]。

2.3 模块化NRPSs催化非核糖体多肽的合成机制

常规的NRPSs装配机制就是顺序合成多肽,NRPSs基因簇中的每个模块都参与了多肽合成中氨基酸的捕获、传递和缩合,并且是按照基因簇模块的顺序而来。这种线性化的催化方式决定了每个模块与最终产物中多肽骨架的结构单元是一一对应的,也就是说,基因簇有几个模块,非核糖体多肽就有对应的几个氨基酸。杆菌肽的生物合成便是如此,按硫模板机制进行非核糖体多肽合成,针对核糖体合成酶基因的克隆和其序列的分析,发现每一个模块的结构域都含能和辅因子结合的保守性丝氨酸残基[34]。除了已知的NRPSs的常规装配机制外,近年来也发现了一些非常规的装配方式如下。

2.3.1 模块重复使用NRPSs

模块重复使用NRPSs也称迭代(iterative)NRPSs合成多肽,是指至少有一个以上的模块被重复使用,产生两个以上的相同缩合单元;简单说是合成产物的肽链氨基酸残基数多于NRPSs的模块数。Mc Cafferty等[35]发现在脂肽类抗生素雷莫拉宁(ramoplanin)的生物合成基因簇中共包含16个模块,而雷莫拉宁共有17个氨基酸残基,前两位氨基酸均为Asn,而起始模块的A结构域负责识别Asn,所以认为起始模块被被重复使用负责雷莫拉宁分子中1位与2位的Asn的上载(图5-1)。

2.3.2 非线性(Nonlinear)NRPSs

指反式(in trans)的氨基酸上载方式,通常情况下,某模块对应的氨基酸底物由外在的A结构域负责活化,将中间体转移到PCP结构域上。但偶尔PCP结构域接受由相邻模块中的A结构域提供的中间体。Keating等[36]发现的耶尔森杆菌素(Yersiniabactin)的生物合成就是一种典型的反式氨基酸上载(图5-2)。主要涉及 HMWP1 和 HMWP2这两个主要的NRPSs,其中只有HMWP2 中含有能够活化氨基酸底物的 A 结构域,HMWP2能特异性识别并激活L-Cys,活化的L-Cys不仅能分别与HMWP2的T1和T2结合,还能与HMWP1的T3相结合,从而完成生物合成过程。

2.3.3 模块跳跃(Module skipping)NRPSs

指功能完整的模块在肽链延伸过程中被跳过,即产物氨基酸残基数少于NRPSs模块数。Pan等[37]发现的myxochromide S是黏细菌产生的带有不饱和聚酮侧链的环肽化合物,介导其生物合成的NRPSs成员(Mch B和 Mch C)具有6个模块,合成的产物(myxochromide S)中却含5个氨基酸残基。通过比较A结构域的特异性识别底物,推断 module 4 被跳跃而未发挥作用(图5-3)。阐明NRPSs的规装配方式,并结合基因组挖掘技术,将会发现更多的复杂肽类天然产物,也为进一步实现体外NRPSs的组合生物合成提供更多的重组信息。


图5 NRPSs的非常规的装配方式

3 新型非核糖体多肽的合成

尽管越来越多的BGCs被揭示,但同时也发现只有其中少数基因簇表达,产生了活性产物,其它不少BGCs在自然条件下并没有表达,也就不参与生物合成,称为“沉默BGCs”。这些“沉默BGCs”就相当于一个有待开发、潜力巨大的信息库。但如何激活这些沉默的BGCs,科研人员们做了各种尝试,比如启动子工程、共同培养、异源表达、高通量诱导子筛选、调控基因遗传改造以及合成生物学等策略有效激活了一系列沉默的基因簇(表2)。滕铁山等[38]发现在微生物培养基中加入组氨酸脱乙酰酶抑制剂辛二氧肟酸、丁酸钠和丙戊酸,以及脱氧核糖核酸甲基转移酶抑制剂5-氮杂胞苷,能够共价修饰脱氧核糖核酸,调节真核基因表达,便于在全基因组水平上改变基因的表达,激活沉默化合物合成相关基因。Yeh等[39]利用启动子工程将曲霉中包含的负责编码fellutamide B的生物合成基因簇中 inp A~D基因的天然启动子更换为诱导型启动子alcAp,在环戊酮的诱导下激活目标基因簇的表达从而合成了新化合物2-hydroxy-5-isobutyl-3-propanamidylpyrazine(2)。


表2 激活沉默生物合成基因簇分离到的新型非核糖体多肽

次级代谢基因在基因组中通常成簇分布,每一个次级代谢基因簇包含次级代谢物合成所需酶的编码基因和转录调控因子,能独自调控该次级代谢途径[45]。表2即为不同途径下激活沉默生物合成基因簇分离到的新型非核糖体多肽类天然产物。同时相关研究在其他途径的作用下能够靶向激活隐性生物合成基因簇分离得到新型天然产物:如Xu等[46]在报告基因指导下的突变株筛选策略(reporter-guided mutant selection,RGMS)途径的作用下,在天蓝色链霉菌(Streptomyces coelicolor)中进行转座子(Tn)突变,以筛选出三吡咯类抗生素十一烷基灵菌红素生产水平发生变化的突变株。侯路宽等[22]通过抑制链霉菌Streptomyces somaliensis SCSIO ZH66中的wblAso基因的表达,利用全局性调控基因遗传改造的途径(manipulating global regulators)使突变株在丧失产孢能力的同时积累多种次级代谢产物,从而分离出 III型聚酮类化合物violapyrone B。

基因组时代的开始揭示了许多隐藏在大量沉默的天然产物生物合成基因簇中的新陈代谢潜力。了解物种间串扰的信号级联,以及转录和翻译水平上的调控,将有助于发现更多沉默的天然产物。随着生态,遗传和合成策略的共同作用,使我们能够更全面地挖掘利用这种日益珍贵的代谢资源。

4 展望

综上所述,微生物产生的非核糖体肽,其结构复杂,种类繁多而具有独特的生理功能和多样化的生物活性。通过非核糖体肽合成酶各个功能结构域的模块式结构之间的相互作用,使得NRPSs的装配得以有序高效地进行,同时常规或非常规的装配方式以及独特的非核糖体合成方式产生了结构多样的非核糖体多肽。

随着基因组测序技术的发展和基因组挖掘技术的深入,对遗传信息进行基因组比对和相关分析技术也越来越完善和进步,人们对细菌和真菌中次级代谢产物的合成基因簇将会有更多的认识,同时伴随着对NRPs合成机理更深入的研究,通过NRPs的生物合成途径生产活性肽也将成为可能,将会有越来越多新型NRPs途径的发现,并最终应用于规模化生产非核糖体活性肽的生物合成中。

免责声明:本文为行业交流学习,版权归 原作者所有,如有侵权,可联系删除。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,386评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,142评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,704评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,702评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,716评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,573评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,314评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,230评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,680评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,873评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,991评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,706评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,329评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,910评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,038评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,158评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,941评论 2 355

推荐阅读更多精彩内容