放线菌未发现的天然产物宝库:大规模代谢组学揭示链霉菌属的次级代谢潜能
《The Journal of Antibiotics》:The undiscovered natural product potential of Actinomycetes
【字体:
大
中
小
】
时间:2025年12月03日
来源:The Journal of Antibiotics 2.1
编辑推荐:
本研究针对微生物基因组中大量生物合成基因簇(BGCs)缺乏实验验证的问题,通过对948株细菌(主要为放线菌)进行非靶向LC-MS/MS代谢组学分析,获得了近200万张MS/MS谱图,注释率仅13.3%。研究人员利用分子网络和光谱库匹配技术,成功鉴定出2352个分子,包括安丝菌素、放线菌素等重要天然产物,并公开了大规模代谢组学数据集。该研究为挖掘微生物天然产物提供了重要资源,显著推进了微生物次级代谢产物的发现与研究。
在微生物的世界里,放线菌尤其是链霉菌属(Streptomyces)一直被誉为"天然药物的宝库"。这些微小的生物工厂能够产生种类繁多的生物活性分子,为人类提供了包括抗生素、抗肿瘤药物和免疫抑制剂在内的诸多重要药物。然而,随着基因组学技术的快速发展,科学家们发现了一个令人困惑的现象:通过基因组挖掘预测到的生物合成基因簇(BGCs)数量远远超过实验验证的天然产物数量。以链霉菌为例,仅有约3%的生物合成潜力得到了实验表征。
这种基因组潜力与实验验证之间的巨大差距,主要源于公共代谢组学数据集的缺乏。虽然基因组挖掘工具如antiSMASH和公共数据库如MiBIG极大地促进了BGCs的发现,但验证这些基因簇实际表达产物的实验数据却十分有限。传统的培养、提取、分离和结构鉴定方法虽然可靠,但耗时耗力,难以应对海量的基因组数据。此外,微生物在实验室条件下的沉默或隐性生物合成基因簇的表达调控复杂性,进一步增加了天然产物发现的难度。
为了解决这一瓶颈问题,由加州大学圣地亚哥分校Andrés M. Caraballo-Rodriguez领衔的国际研究团队在《The Journal of Antibiotics》上发表了重要研究成果。研究人员收集了948株微生物菌株(主要为放线菌),通过液相色谱-串联质谱(LC-MS/MS)技术进行了大规模的非靶向代谢组学分析,获得了近200万张MS/MS谱图。令人惊讶的是,尽管放线菌是研究最为深入的微生物类群之一,该研究仅实现了13.3%的注释率,对应2352个已注释分子,这意味着仍有大量未知天然产物等待发现。
研究团队采用了多方面的技术策略来最大化数据的科学价值。他们首先对440株放线菌在五种不同培养基(ISP-2、ISP-4、TSA、NSG和CZP)中进行培养,采用OSMAC(一株多化合物)策略来激活沉默生物合成基因簇。通过高分辨率质谱进行数据依赖性采集(DDA),并利用分子网络技术对MS/MS谱图进行可视化分析。关键的是,研究人员将实验数据与GNPS(全球天然产物社会分子网络)平台上的30多个公共光谱库进行比对,并采用注释传播策略将注释数量翻倍。此外,他们还开发了包含515个链霉菌已知产物的数据库,通过预测碎片谱图进行比对验证。所有数据集均已整合到MassIVE(质谱交互虚拟环境)和microbeMASST等公共平台,支持全球研究人员的后续挖掘。
检测948株细菌中的微生物分子
研究团队通过优化培养条件,在五种培养基中培养了440株放线菌,并额外分析了508株在ISP-2培养基中培养的细菌分离株。结果显示,ISP-2培养基在支持微生物生长和代谢物检测方面表现最佳,这与该培养基与质谱技术的良好兼容性相关。通过分子网络分析,研究人员将碎片谱图表示为节点,基于光谱相似性进行连接,并与光谱库进行比对鉴定。
研究数据显示,尽管每个培养基都产生了大量独特的MS/MS谱图,但所有五种培养基共享7719个MS/MS谱图,表明这些培养基均适合微生物代谢物的生产。 upset图分析进一步揭示了不同培养条件下代谢物谱的差异性和重叠性,为后续的条件优化提供了重要参考。
数据注释
通过对1,947,363张碎片谱图进行分析,研究人员获得了105,499个独特的MS/MS谱图。利用GNPS平台上的公共参考库,研究团队实现了13.3%的注释率,对应2352个分子。通过注释传播策略,注释数量从1235个增加到2352个,显著提升了数据的可利用价值。
研究鉴定出了多种重要生物活性分子,包括安丝菌素(depsipeptide类抗生素)、放线菌素(抗生素和抗癌化合物)、吡啶酸(植物抗逆性相关聚酮化合物)以及去铁胺(铁螯合剂)等。这些注释不仅验证了方法的可靠性,也为后续的生物活性研究奠定了基础。
发现潜力评估
通过稀疏曲线分析,研究人员评估了数据集的发现潜力。结果显示,已注释的分子家族为328个,而未注释的分子家族超过8000个,表明仍有大量未知化学多样性等待探索。通过NPClassifier进行化学分类分析发现,不同培养基在检测特定生物合成途径产物方面存在显著差异,其中ISP-2培养基在多种生物合成途径中表现出最一致的检测性能。
新发现示例:edaphochelins
作为数据集发现潜力的例证,研究人员检测到了与megalochelin相关的非核糖体肽铁载体类似物。通过ModiFinder工具分析,成功预测了edaphochelin A中额外的甘氨酸残基位置,这与该分子的化学结构完全一致。
研究结论与意义
该研究通过大规模代谢组学分析,揭示了放线菌尤其是链霉菌属巨大的天然产物发现潜力。尽管这些微生物是研究最为深入的类群之一,但仍有大量未知代谢物等待发现。研究人员提供了1215个注释谱图,对应698个非冗余微生物分子,以及基于传播注释的116个额外注释。
这项工作的科学意义不仅在于提供了大规模的公开代谢组学数据集,更重要的是建立了一个支持微生物天然产物发现的研究框架。通过将实验数据与公共平台整合,该研究为后续的基因-代谢物关联分析、沉默基因簇的激活以及新生物活性物质的发现提供了宝贵资源。随着更多研究人员的参与和数据挖掘的深入,这一数据集有望催生新型抗生素和其他生物活性分子的发现,为解决日益严重的抗生素耐药性问题提供新的解决方案。
研究的局限性主要源于培养条件、提取方法和质谱设置的固定性,以及谱图中存在的加合物、源内碎片和多聚体等冗余信息。尽管如此,这项工作无疑为微生物天然产物研究开启了新的篇章,为全面解析微生物的化学多样性奠定了坚实基础。
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号