基于结构的RiPP识别元件的发现与定义

《mSystems》:Structure-based discovery and definition of RiPP recognition elements

【字体: 时间:2025年11月19日 来源:mSystems 4.6

编辑推荐:

  本研究通过整合Foldseek结构搜索工具和AlphaFold 3预测模型,显著提升了RRE(肽类生物合成识别元件)的检测精度与覆盖范围。采用结构比对发现超过9万条高置信度RRE序列,构建11组新型HMM模型并优化现有模型,使RRE-Finder的蛋白检索量增加174%。结合AlphaFold 3预测的RRE-肽复合物结构(如PbtF-RRE晶体解析),识别出13种新型识别序列(如WxxP、FxLD等),并通过体外结合实验验证了预测准确性。研究还发现RRE结构在真核生物中的存在,并揭示了其进化多样性及 Horizontal Gene Transfer趋势。这些成果为RiPP(肽类生物合成)途径的挖掘和工程化提供了新工具。

  近年来,科学家们对天然产物的探索日益深入,其中,核糖体合成并翻译后修饰的肽(RiPPs)因其结构多样性和潜在的生物活性而备受关注。RiPPs 是一类由基因编码的前体肽经过酶促修饰形成的天然产物,具有广泛的生物功能,包括抗菌、抗病毒和抗癌等。然而,传统的基于序列相似性的发现方法在识别高度序列发散的 RiPPs 时存在显著的局限性,尤其是那些与已知 RiPP 类别没有明显序列相似性的修饰酶或前体肽。为了解决这一问题,研究人员采用了一种基于结构信息的全新策略,结合结构比对工具 Foldseek 和 AlphaFold 数据库,以提高 RiPP 识别的准确性和全面性。

RiPP 的生物合成通常依赖于一种称为 RiPP 识别元件(RRE)的保守结构域。尽管 RRE 的序列可能高度发散,但其三级结构在不同 RiPP 类别中保持一致,这种结构的保守性使得 RRE 成为一种有效的非类别依赖的识别工具。然而,传统方法在识别这些结构域时常常受到序列相似性限制,导致大量假阳性结果。为了提高识别准确性,研究团队引入了 Foldseek,一种快速的结构比对工具,用于在 AlphaFold 数据库中搜索 RRE 的保守结构。Foldseek 的使用显著提高了 RRE 识别的覆盖率,并减少了假阳性率。通过对 AlphaFold 预测结构的详细分析,研究人员确定了合理的 bitscore 阈值,从而筛选出高置信度的 RRE 结构域。

为了进一步提高识别精度,研究团队构建了 11 个新的 Foldseek 衍生的隐马尔可夫模型(HMMs),这些模型基于结构保守性较强的 RRE 域,并通过改进种子比对、结构域剪裁、bitscore 阈值和 Pfam 过滤等方法进行优化。这些新模型的加入显著扩展了 RRE-Finder 的识别能力,使得其在 UniProt 数据库中能够识别出超过 90,000 个高置信度的 RRE 结构域。此外,通过结合 AlphaFold 3 的结构建模技术,研究团队预测了超过 8,000 个 RRE 与前体肽的复合物,从而识别出 13 种不同的识别序列,覆盖了多种 RiPP 生物合成基因簇(BGCs)。

在结构预测的基础上,研究团队进一步通过实验验证了 RRE 与前体肽的结合模式。例如,研究团队利用晶体学技术解析了 pyritide(硫肽)RRE 与其前体肽的复合物结构,分辨率达到 1.23 ?。这一实验不仅验证了 AlphaFold 预测的准确性,还揭示了 RRE 与前体肽之间具体的相互作用位点,如 Leu(–29) 和 Phe(–24) 与 RRE 的 α3 结构域之间的氢键和 π-π 堆叠作用。此外,研究团队还采用双丙氨酸扫描策略,结合亲和纯化和液相色谱-质谱(LC-MS)技术,验证了其他 RRE 与前体肽的结合情况,进一步支持了 AlphaFold 预测的可靠性。

研究还发现,某些 RRE 域的结构特征可能在不同的生物分类群中存在,如真核生物中的某些 RRE 域与细菌 RRE 域在结构上相似,但其序列不完全一致。这表明 RRE 的结构保守性可能跨越多个生物分类群,从而拓展了其在 RiPP 发现中的应用范围。此外,研究团队发现,一些 RRE 域可能与其他结构域融合,这种融合结构可能赋予其新的生物功能,如增强修饰酶的活性或引导前体肽进入特定的生物合成途径。

通过这些结构和功能的分析,研究团队不仅提高了 RRE-Finder 的识别精度,还揭示了 RRE 在 RiPP 生物合成中的多样性。这种基于结构的发现策略为未来的 RiPP 基因簇挖掘提供了新的视角,使得科学家能够更全面地探索潜在的生物合成途径。此外,AlphaFold 的结构预测能力在 RRE 与前体肽相互作用的研究中发挥了重要作用,不仅加速了识别过程,还提供了结构生物学上的新见解。

综上所述,这项研究通过结合结构比对工具 Foldseek 和 AlphaFold 3 的预测能力,显著提高了 RRE 的识别精度和范围。这不仅有助于发现新的 RiPP 基因簇,还为理解 RiPP 的生物合成机制提供了重要的结构基础。随着结构生物学和计算方法的不断发展,未来的 RiPP 研究将更加依赖于结构信息,以更高效地识别和设计具有特定生物活性的天然产物。这一进展为生物技术、药物开发和生物工程等领域提供了新的机遇,同时也为探索微生物多样性和生物合成潜力开辟了新的道路。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号