《Applied and Environmental Microbiology》:Secondary metabolism of Microcystis: current understanding and recent advances in unlocking genomic and chemical diversity
编辑推荐:
这篇综述系统梳理了微囊藻(Microcystis)次级代谢产物的遗传与化学多样性,重点总结了其生物合成基因簇(BGCs)的分布、多种已知(如微囊藻毒素MC)和未表征代谢物的特性、潜在环境驱动因子(如氮N、磷P)以及生理生态功能(如群体形成、捕食者防御),并展望了整合宏基因组学、代谢组学等高通量多组学技术以揭示其巨大生物合成潜力的机遇与挑战。
微囊藻次级代谢的广阔世界
微囊藻属蓝藻在全球分布,以其产生微囊藻毒素而闻名。然而,微囊藻的生物合成能力远不止于此。其多样的基因组中含有多种生物合成基因簇,编码的代谢物可能具有毒性、重要的生态功能,或在生物技术或药物发现中有应用潜力。本文旨在综述当前关于微囊藻次级代谢在遗传和化学多样性、合成的潜在驱动因素以及生理和生态功能方面的知识体系,并强调需要进一步研究以表征环境中微囊藻群落尚未被探索的遗传和化学多样性。
基因组视角下的次级代谢物多样性
对微囊藻培养物的研究揭示了其次级代谢物及其合成BGCs的高度多样性。BGCs约占微囊藻基因组的2%–7%,并且通常在全基因组范围内分布。水平基因转移可能在BGC的获取中起作用。BGCs也被认为是动态的,具有严格的转录调控和频繁的基因顺序重排。目前,在MiBIG数据库中有13个与微囊藻产生的代谢物相关联的BGCs被收录,所有条目描述的基因簇都编码通过非核糖体肽合成酶、杂合NRPS/PKS或核糖体途径合成的蓝藻肽。
不同微囊藻亚支系内的菌株间BGC的基因组内容往往相似但不完全相同。每个微囊藻菌株或物种可能含有一套共同进化、针对其特定环境条件量身定制的次级代谢物 arsenal。然而,基因簇的存在并不保证生物合成,因为这些簇可能受到转录调控,并通过转座或重组而失活。自然系统中的生物合成也可能取决于多种非生物和生物因素。因此,将基因组挖掘作为生物合成潜力的蓝图至关重要,但宏转录组学和化学分析等方法对于确定哪些次级代谢物正在被主动生物合成也至关重要。
已表征的次级代谢物
微囊藻毒素
微囊藻毒素是高效的真核生物蛋白磷酸酶1和2A抑制剂,可导致肝脏损伤等疾病,在极端情况下甚至死亡。MCs是环状七肽,含有不寻常的Adda结构域。其结构中的X和Z氨基酸位置具有高度可变性,这极大地影响了所产生异构体的毒性。MCs由包含NRPS、PKS和杂合PKS-NRPS酶的多酶复合物非核糖体合成。在微囊藻中,该基因簇包含10个mcy基因,编码生物合成以及推定的修饰和转运酶,并由mcyA和mcyD之间的双向启动子控制。mcy BGC是动态的,经常发生重组和点突变,这些遗传亚结构的变化会影响异构体的产生。尽管MCs具有全球重要性和对健康的影响,但其在微囊藻生理和自然群落中的功能作用仍然难以捉摸,提出的作用包括底栖生存、铁获取、营养代谢和储存、捕食者防御、群体形成、化感作用、群体感应、氧化应激保护和光合作用等。
微囊藻毒素以外的已表征次级代谢物
鱼腥藻素是线性四肽,抑制胰蛋白酶活性,由NRPS BGCs编码。该类代谢物含有不寻常的基团,如Hpla和Choi。其生物合成基因在aer操纵子中具有高度多样性,核心基因保守,但辅助或修饰基因在序列结构和存在与否上变化较大。
蓝藻肽肽是肽内酯,含有内酯环、Ahp残基和正己酸基团。它们可以通过胰蛋白酶抑制对真核生物产生抑制效应。编码蓝藻肽肽的NRPS生物合成基因簇高度多变,即使在同属内也是如此。操纵子可能缺少整个基因但仍能合成完整的蓝藻肽肽异构体。
环酰胺是核糖体合成的大环分子,属于蓝藻肽类。其特征性代谢物包括吡啶环酰胺、气环酰胺、微环酰胺和气单胞菌酰胺等。它们的化学结构可能带有各种官能团。有证据表明合成产物用于捕食者防御,并且该类物质在生物技术药物发现方面具有高潜力。
微病毒素也是核糖体合成的代谢物,但其独特之处在于含有不寻常的三环结构和几个酯键。前体肽基因如mdnA在微囊藻菌株间缺乏保守性,可能导致该类的化学多样性。微病毒素异构体具有一系列细胞毒性效应。
微荚胺是线性肽,抑制多种肽酶。编码微荚胺的BGC是一个杂合NRPS/PKS簇。这些肽的大小差异很大,并且可能与其他代谢物如微囊藻毒素共同产生。近年来,由于其血管紧张素转换酶抑制活性和在药物中的应用潜力,微荚胺受到更多关注。
与许多其他蓝藻属一样,微囊藻可以产生鱼腥藻肽肽,这是环状六肽,对哺乳动物羧肽酶具有纳摩尔级的抑制效应。该类是继微囊藻毒素之后研究第二多的蓝藻肽类,其BGC可能通过水平基因转移从浮丝藻属获得。有报告显示,在伊利湖西盆地,鱼腥藻肽肽的浓度通常高于微囊藻毒素。
未表征的次级代谢物
微囊藻的基因组显示了大量尚未与已知代谢物关联的BGCs,这可能预示着大量未被发现的生物合成多样性。将已表征或新发现的化合物与其相应的BGC高通量地关联起来,可以通过整合配对的基因组学和代谢组学数据分析来促进。
在IMG/MER数据库中,有58个高质量的微囊藻属基因组。从这些基因组中,有13个BGCs已被表征并存入MiBIG数据库。基因注释可能提供有关感兴趣代谢物的线索;然而,将代谢组学和基因组学数据配对对于理解这些次级代谢物的合成和结构至关重要。由于微囊藻基因组每个往往有约10到15个BGCs,其中许多尚未与产物关联,因此需要持续的研究来直接关联菌株、BGCs和化学结构。
虽然探索“蓝藻肽”的范围和多样性很重要,但编码各种PKS、萜类和核糖体途径的广阔BGC资源也不应被忽视。微囊藻中通过PKS途径合成的化合物在很大程度上仍未表征。从伊利湖西部的宏基因组中鉴定出的几个新的PKS-BGCs具有转录活性,表明产生了具有聚酮化合物性质的分子。在蓝藻水华中,这些相同的BGCs可能是最丰富和表达最高的之一,这强调了理解其生理和生态功能的必要性。
环境驱动因素
人为富营养化和环境变化导致了蓝藻水华事件在全球范围内的持续、加剧和蔓延。磷输入长期以来被认为是促成蓝藻水华形成的一个驱动因素。然而,氮也被认为是一种限制性或共同限制性营养盐,最终改变蓝藻水华的组成、强度和毒性。必须考虑的其他因素包括温度升高、大气二氧化碳浓度增加以及水柱中溶解氧减少。然而,越来越多的证据表明,营养盐可用性,特别是次级代谢物的构建模块(往往是富氮化合物),可能对微囊藻次级代谢产生最大影响。
氮对微囊藻主导的蓝藻水华的贡献最近受到更多关注。氮的可用性及其与碳和磷的化学计量关系既影响微囊藻毒素的产量,也影响异构体的相对丰度。一些模型研究表明,计划的磷减排不仅会减少生物量,还会缓解氮限制,从而增强富氮次级代谢物如微囊藻毒素的生产。类似的趋势也可能出现在其他富氮次级代谢物上。未来的工作应扩展到包括微囊藻产生的更广泛的富氮次级代谢物。另一个新兴的研究领域是了解微囊藻微生物组如何促进氮的处理和吸收,这可以影响蓝藻毒素的生产。
次级代谢物合成物的拟议功能作用
关于微囊藻衍生代谢物原位功能作用的证据有限。大多数假设来源于培养实验,并且大部分工作集中在MCs上,对此仍无共识。关于生产驱动因素存在几种相互竞争的假设,并且次级代谢物可能具有多功能作用,特别是在微生物相互作用方面。体外研究表明微囊藻衍生代谢物具有化感作用性质,并通过种间和种内竞争帮助获得优势。一些研究表明微囊藻次级代谢物可用于防御多种捕食者,尽管其他工作表明增加的捕食并不会刺激推定的捕食防御代谢物合成的上调。相反,有人认为这些代谢物不是拮抗性质的,而是有助于在藻际圈招募“帮手”细菌。需要更有针对性的研究来明确确定微囊藻的次级代谢物如何介导微生物相互作用。
越来越多的工作也表明,微囊藻次级代谢物的产生是为了帮助细胞内过程,而不是自然群落组合内的通讯或化感作用。MCs结合蛋白质,包括RubisCO,在快速生长或高光条件下提供免受活性氧物种的保护。由于几种微囊藻次级代谢物是富氮的,它们可能在重要营养盐的代谢和储存中发挥作用。例如,MCs的生产依赖于氮浓度,并可能受全局氮调节因子ntcA的调控,该因子结合mcy操纵子启动子并在氮耗尽条件下抑制转录。对MCs细胞内作用的这项研究应扩展到探索其他微囊藻次级代谢物的细胞内功能。
组学技术的进步开启次级代谢物研究的新时代
进展
DNA测序成本的大幅降低对于揭示来自培养分离物和自然种群的微囊藻广泛的种内多样性至关重要。第三代测序平台正在稳步提高微生物基因组的质量。在IMG/MER数据库中,只有九个微囊藻基因组被标记为“完成”。这九个基因组中,有七个是使用PacBio测序完成的,所有九个都是在培养分离物上完成的,这反映了由于微囊藻基因组富含重复序列和异质性,使用短读长测序组装完整基因组的挑战。未来的微囊藻基因组测序工作应继续在环境样本中实施长读长或邻近连接测序,以识别可能编码在培养物中未观察到的新化合物的隐蔽BGCs。
代谢组学领域也由于数据处理和分析工具的改进和可及性而迅速扩展。最常用的方法是液相色谱-质谱法,因为它能够灵敏地检测大量种类的代谢物。串联质谱已广泛应用于环境样品,通过次级碎片分析和特征分析,使得识别和区分更多化合物成为可能。虽然这些方法适用于新化合物发现和初步特征表征,但它们也可借助标准品用于检测已知的微囊藻次级代谢物,在24小时内实现检测和定量。
为协作和可及性研究开发工具和存储库的最新努力为次级代谢物研究开辟了新途径。BGC挖掘软件以及数据存储库提供了丰富的基因组和代谢物数据——包括新化合物和已知化合物。
机遇
次级代谢物研究的一个主要机遇是将原位组学数据集整合到一幅全面的图景中,了解微囊藻在自然系统中生产什么以及为什么生产。目前许多公开可用的组学数据集仅包含单一的组学方法,并且缺乏环境或实验条件的元数据,使得确定生产驱动因素和机制具有挑战性。整合的多组学数据和配对的辅助环境数据对于识别和确定次级代谢物的功能是必要的,但具有挑战性,可能需要多种建模和网络方法。采用“多组学”数据集集成与基本建模方法对于更好地理解微囊藻的次级代谢物多样性和功能性至关重要。
基于田间的、采用从头基因组组装和非靶向质谱方法的新型微囊藻种群研究,为发现新的微囊藻次级代谢物和理解微囊藻次级代谢物在真实群落中原位的动态提供了高潜力。虽然实验室分离培养物对各种分析很有价值,但它们往往不能代表环境微生物的广度和多样性。随着“宏组学”研究变得越来越普遍,我们看到了大量先前未描述的和推定的BGCs,以及几种新的次级代谢物和异构体。发现也高度依赖于从头组装和非靶向质谱方法,因为依赖参考数据库或标准品限制了检测先前未表征的BGC或代谢物的能力。随着我们继续改进能够将基因与化合物关联的分析流程,我们将需要考虑如何最好地增强预测模型和机器学习,以整合新发现的BGCs和代谢物。
结论
微囊藻次级代谢的范围和多样性是巨大的,并且仍然缺乏很好的表征。尽管一些微囊藻次级代谢物已与BGCs关联,但对于大多数微囊藻次级代谢物而言,其异构体多样性、生态和生理功能以及合成机制仍未解决。未来的研究应优先考虑关联孤儿BGCs和代谢物,并侧重于将自然群落作为理解化学多样性和合成驱动因素的来源,特别是考虑到微生物群落的多样性以及越来越多的证据表明许多次级代谢物参与种间相互作用。与其他研究一样,本综述强调需要将我们的焦点转向微囊藻毒素以外的其他微囊藻次级代谢物,因为其中几种在环境中含量丰富,并具有可能影响食物网或对公共健康构成威胁的毒性特性。此外,来自培养分离物和环境样本的丰富的新的微囊藻BGCs和代谢物可能是新型生物技术应用或药物发现的来源。无论动机如何,微囊藻属将继续是次级代谢物研究的丰富来源,因为我们对