综述:增强微生物天然产物药物发现的新兴策略

【字体: 时间:2025年10月11日 来源:Current Opinion in Biotechnology 7

编辑推荐:

  本综述系统梳理了2022-2025年间微生物天然产物(NP)药物发现领域的前沿技术,重点介绍了基于CRISPR的隐性生物合成基因簇(BGC)激活、细胞游离生物合成(CFB)平台以及人工智能(AI)与信息学工具在结构生成与关联研究中的应用,为克服传统发现方法的瓶颈提供了多维度创新策略。

  
引言
天然产物(NPs),或称次级代谢产物,是生物体为在环境中获得竞争优势而产生的生物活性化合物。这些强效化合物因其治疗潜力已被人类利用数千年。天然产物表现出多种多样的生物活性——包括抗菌、抗炎和抗癌等——使其成为药物发现的基石。微生物由于其显著的分类学多样性和生物合成复杂性,是天然产物的主要来源。据估计,目前所有抗菌药物中约有70%来源于微生物,这凸显了其在制药行业中的重要性。历史上,微生物天然产物的发现依赖于繁琐的生物活性指导分离技术,但这种方法只能获取一小部分化合物。许多天然产物产量极低或在实验室条件下不稳定,这为其发现和研究设置了巨大障碍。为应对这些挑战,生物技术领域的发展提供了新的方法来发现传统手段难以企及的天然产物。
激活隐性生物合成途径的增强策略
基因组分析的发展加速了对沉默和隐性生物合成基因簇(BGC)的发现,进而推动了对当前基因操作工具的改进。此类工具可大致分为两类:在原生菌株中激活BGCs,或为在异源宿主中增强表达而重新设计BGCs。
CRISPR辅助激活原生生物合成基因
自发现以来十三年间,CRISPR-Cas9因其基因编辑能力而被广泛用于激活沉默的BGCs。近期与其他基因编辑工具的结合,扩展了其可应用的细菌物种范围。对Cas9的修饰提高了其在链霉菌属(Streptomyces)中的效率。一项创新性策略是重新设计I类CRISPR系统用于非模式链霉菌的基因操作。例如,Zhou等人开发的双质粒系统可表达修饰的CRISPR-Cascade复合物和支架RNA(scRNA)。该复合物整合后,任何scRNA的模块化整合使得这种方法成为靶向激活BGC的灵活且高效的平台。由于这些系统是许多链霉菌属所固有的,CRISPR-Cascade复合物的接合效率被发现高于外源的Cas9。
组合式重构用于多酶优化
重构策略在基因激活方面也取得了新进展。靶向初级代谢和次级代谢的交叉点已成为重构过表达的一个新兴策略,近期研究识别了参与许多天然产物合成的初级代谢物。一些研究强调了表观遗传调控的作用,而另一些则识别了能显著改善天然产物产量且不影响邻近基因的关键调控蛋白。Xue等人最近实施了一项创新的重构和异源过表达策略,以增强厚壁菌门(Firmicutes)中III类羊毛硫肽(lanthipeptide)的生产。该策略将编码羊毛硫肽前体肽的基因克隆到复制型质粒上,而将编码相应翻译后修饰(PTM)酶的基因克隆到整合型质粒上,随后在枯草芽孢杆菌(Bacillus subtilis)168宿主中共同表达。这种组合策略使得研究小组能够研究重构BGC产生的新型羊毛硫肽(命名为paenithopeptins)的结构和活性,这些肽含有罕见的N,N-二甲基化,赋予了抗菌活性。该策略在另一编码bacinapeptin的III类羊毛硫肽BGC中也观察到类似的过表达水平,表明其具有用于研究其他羊毛硫肽BGC的潜力。
用于天然产物生产和修饰的细胞游离策略
基于细胞的方法在天然产物发现中很常见,但可能因宿主菌株或培养条件未优化而受到阻碍。此外,通过这些方法可获取的化学空间受限于当前已知BGCs的范围。细胞游离方法因此被开发出来,通过柔性酶(Fx)引导的de novo肽合成和高通量天然产物功能化来解决这些问题。
体外转录和翻译产生新型肽及其他天然产物**
细胞游离生物合成(CFB)系统的改进使得能够基于DNA模板的体外转录翻译(IVT)进行高通量天然产物发现。利用该方法可以轻松生成肽,而添加PTM酶和Fx(一种能够使tRNA装载非经典氨基酸(ncAAs)的核酶)则极大地增加了其潜在结构多样性。例如,可以利用计算算法设计具有用户定义特征的新型核糖体合成和翻译后修饰肽(RiPPs),并通过CFB快速生产。人工智能(AI)也被用于设计新型抗菌肽(AMPs)和硫肽。近期研究通过利用核糖体生成非标准骨架或引入PTMs以添加多样化官能团,扩展了可获取的天然产物化学空间。除了核糖体,非核糖体肽合成酶(NRPSs)和聚酮合酶(PKSs)也已在细胞游离系统中成功表达,为未来研究这些复杂酶产生的多样化天然产物打开了大门。Pelton等人的工作体现了当前的CFB努力,他们通过化学信息学审视该技术的局限性并加以改进。他们首先开发了一种算法来检查已知肽类天然产物的结构和物理化学性质,并根据大小、环化类型、是否存在ncAAs等参数对其进行分类。这些数据被用来识别当前CFB无法获取的肽构建模块,从中他们选择了ncAA哌嗪酸盐(Piz)进行进一步开发。虽然Piz在细胞内仅由NRPSs掺入,但Pelton等人设计了Fxs使其能在细胞游离系统中被核糖体利用。他们的方法不仅扩展了CFB可获取的化学空间,也为未来de novo设计含ncAA的肽类天然产物奠定了基础。
高通量天然产物修饰用于类似物生成
尽管天然产物效力强,但通常需要修饰才能达到类药物性质。这个耗时的过程使得开发高通量修饰平台成为该领域的迫切需求。RiPPs因其生物合成相关的多种PTM酶而成为修饰的优秀候选者,这些酶能够实现选择性定制。这些酶通常具有广谱底物特异性,可以修饰各种天然产物以生成多样化的天然产物衍生物和嵌合体。对多环天然产物的酶促和化学修饰也显示出产生强效天然产物衍生物的潜力。Yamamoto等人最近开发了一个用于高通量类似物生产的有趣平台,通过组合连接策略设计AMPs。他们利用靶向MraY(一种参与细菌肽聚糖合成的跨膜蛋白)化合物的结构相似性,并建立了一个化合物库作为起点。然后将抗MraY化合物分为核心部分和附属部分,并在切割位点添加反应性基团。随后将功能化的片段重新组合,生成一系列随机化的抗菌类似物。这种灵活的平台可应用于其他具有结构相似性的天然产物,使其能够用于高通量研究。
预测和表征天然产物的计算策略
旨在分析和利用大数据的技术已成为天然产物发现工作流程中不可或缺的一部分。对此,人工智能(AI)和信息学因其无与伦比的分析能力和处理海量数据集的能力而成为首选工具。以下部分将重点介绍利用AI生成能力来产生新结构、处理大型未注释化学数据集以及连接信息学数据以将天然产物与人类疾病联系起来的技术进展和工作流程。
通过生成式AI扩展化学空间
AI工具因其能够识别传统分析工具无法发现的模式,已成为识别具有生物活性的类天然产物化合物的越来越有吸引力的方法。基于机器学习和深度学习的工具利用基因组和代谢组数据,已应用于从海量数据集中发现天然产物并以前所未有的水平解读数据。同样,生成式工具可以利用这些隐藏的趋势来创建具有理想特征的结构。由此产生的化合物随后可以根据其药理学特性进行优先级排序和验证。Tay等人采用了一种具有长短期记忆(LSTM)循环神经网络(RNN)架构的生成式AI模型,以前所未有的规模生成结构。通过使用来自COCONUT数据库的40万个已知天然产物训练模型,它能够将结构标记化为构建模块,并按照相似的化学逻辑将它们重建为推定的天然产物。该模型生成了一个包含超过6700万个独特类天然产物结构的数据库,其规模是COCONUT数据库的165倍,甚至扩展了其化学空间。此前此类尝试的 novelty 和规模均有限,使得该集合成为下一代计算天然产物发现的关键转折点。
质谱数据集的结构注释以发现新化学
从高分辨率/精确质量(HRAM)质谱仪收集的公开质谱(MS)数据促进了众多软件工具的开发,以帮助研究人员发现天然产物。两个值得注意的基于机器学习的工具——COSMIC(小分子鉴定置信度)和MSNovelist——已成为从非靶向串联质谱(MS/MS)数据中注释代谢物的互补方法。COSMIC利用传统或in silico生成的光谱库,结合支持向量机生成的置信度分数,为已报道和未报道的结构提供高置信度的结构注释。该工作流程使得能够从一个公开的小鼠粪便代谢组学数据集中鉴定出12种先前未知的胆汁酸结合物,展示了其在未知代谢物发现方面的巨大潜力。与COSMIC互补,MSNovelist使用编码器-解码器RNN根据输入光谱的结构指纹生成de novo结构注释,从而能够注释基于光谱库匹配方法未能捕获的代谢物。COSMIC(作为CSI:FingerID的一部分)和MSNovelist都已集成到化学信息学工具Sirius中,为简化的代谢组学工作流程提供了一个平台。
将人类微生物代谢物与疾病状态相关联
数十万个微生物测序项目已被存入公共数据库,以推动新型天然产物的发现。然而,预测其生物学作用仍然是一个具有挑战性的瓶颈。鉴于人类相关微生物产生的代谢物可以影响人类健康,利用这些关系可能有助于将人类微生物天然产物优先列为候选药物。因此,Older等人实施的一项新策略建立了一种方法,将人类微生物中生物合成酶的存在与人类疾病发病率相关联,以发现具有生物活性的微生物天然产物。利用来自炎症性肠病多组学数据库(IBDMDB)的宏基因组数据,作者发现炎症性肠病(IBD)与人类肠道微生物中三种产生磺酸脂(SoLs)的生物合成酶的丰度呈负相关。这种关系强烈表明SoLs的产生可能与预防IBD有关,促使Older等人随后优先研究SoLs的生物学特性。他们随后证实,在结肠炎小鼠模型中施用SoLs可减轻IBD症状的严重程度,证明了信息学在确立天然产物与疾病相关性方面的价值。类似的利用代谢组学数据的关联策略已被用于建立人类微生物N-酰基脂质与HIV之间以及人类微生物芳香族氨基酸代谢物与肥胖之间的联系。总体而言,这些研究证明了利用大数据进行生物活性天然产物发现的价值。
结论
生物技术的发展使得能够发现那些在后基因组时代也曾被认为难以获取的微生物天然产物。隐性BGCs激活和CFB技术的进步提供了前所未有的生物合成控制水平,可以产生先前不可见的天然产物。同时,信息学和AI的发展可以利用不断增长的大数据资源来靶向和预测具有高生物活性潜力的天然产物。随着这些策略的不断发展,开发经济高效且流程简化的技术版本的努力将使其得到广泛应用并最大化其影响力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号