基于深度强化学习的抗菌肽智能设计模型AMPainter:实现抗菌活性精准“绘制”与功能进化

【字体: 时间:2025年09月14日 来源:Advanced Science 14.1

编辑推荐:

  本刊推荐:本研究创新性地开发了基于深度强化学习(DRL)的抗菌肽(AMP)设计框架AMPainter,成功整合了序列优化(已知AMP活性提升)与从头生成(de novo设计)双重任务。该模型通过策略网络定位突变位点、经微调蛋白质语言模型(Ankh)解码残基类型,并依托超图神经网络活性预测器(HyperAMP)进行迭代优化,实现在已知AMP、信号肽(SP)及随机序列三类底物中高效进化出高活性AMP(实验验证成功率最高达80%)。多项进化肽表现出128倍抗菌活性提升(MIC降低),且体内外实验验证其膜靶向特异性与低耐药性诱导潜力,为耐药菌感染防治提供了人工智能驱动的创新方案。

  

1 引言:抗菌肽设计的挑战与机遇

微生物耐药性问题日益严峻,每年导致超70万人死亡,预计2050年可能达千万。抗菌肽(AMP)因膜破坏机制和广谱抗菌特性,成为克服耐药性的理想候选药物。尽管现有数据库收录超过3万种AMP,但其在巨大序列空间中分布稀疏,需进一步探索。计算模型为AMP发现和优化提供了高效途径,现有方法可分为优化(提升已知AMP活性)和生成(从头设计)两类,但当前模型多针对特定场景开发,缺乏统一框架。定向进化案例启示我们:通过施加进化压力,可增强蛋白质原有功能或获得新能力。强化学习(RL)在蛋白质工程中展现出探索广阔序列空间(20L)的潜力,但其在从头序列设计中的应用仍受限。

2 方法创新:AMPainter框架设计与核心模块

AMPainter模型包含三个核心模块:策略网络(Policy Network)选择突变位点、微调蛋白质语言模型(Ankh)解码残基类型、以及抗菌活性预测器HyperAMP评估突变序列。其中HyperAMP采用多级超图神经网络(HGNN),将肽序列划分为2/3/4-gram片段构建超图,利用残基级节点特征(Ankh嵌入)和片段TF-IDF权重进行消息传递,最终 concatenate 多级嵌入进行回归预测。该模型在测试集上Pearson相关系数达0.9220±0.0009,RMSE为0.1631±0.0001,显著优于传统Transformer、CNN-LSTM等基线模型。

训练过程中,AMPainter采用REINFORCE算法进行策略梯度更新,每条序列经历8次迭代突变(平衡活性与多样性)。模型在40个训练周期中,平均奖励分数从0.26提升至0.78,验证了框架的有效性。特别值得注意的是,通过微调语言模型桥接突变解码,显著提升了进化效率(对比未微调版本和随机突变基线)。

3 性能验证:全方位超越现有方法

在已知AMP优化任务中,AMPainter与10种主流方法(包括HydrAMP类比生成模式、EvoPlay、PEX、MCMC等)进行对比。使用200条未见AMP序列测试表明:

  • 经MBC-Attention和AMP-READ模型评分,AMPainter进化序列抗菌活性分布显著优于对照组(p<0.001)

  • 六种AMP分类器(AMPScannerV2、CAMPR4系列、MACREL、ampir)预测概率均值>0.9

  • 序列多样性分析(Levenshtein距离)显示,Top50/100序列多样性居首

    在Pg-AMP1片段优化实验中,AMPainter经5轮进化获得0.624的适应度分数,超越遗传算法(GA)和三种VAE模型,且进化序列呈现典型的两亲性螺旋结构(富含亮氨酸L和精氨酸R交替模式)。

4 多场景应用:三类底物的高效进化

模型在三种初始序列集上展现强大进化能力:

  • 已知AMP优化:200条AMP经进化后,最佳序列评分显著提升(Δscore>0),实验验证A05肽对枯草杆菌MIC从16μM降至0.25μM(活性提升64倍)

  • 信号肽(SP)转化:708条细菌信号肽经进化后,80%(8/10)实验验证成功获得AMP功能,且所有HC25值>128μM,显示优异膜选择性

  • 随机序列从头设计:200条随机序列进化后,60%(6/10)成为功能性AMP,其中R04肽对四种细菌平均MIC仅2.88μM(对金黄色葡萄球菌MIC低至0.5μM)

    进化序列氨基酸频率分析显示:阳性电荷残基(K/R)频率显著增加,阴性电荷残基(D/E)几乎完全被替换,疏水残基(L/I)占比提升,与天然AMP分布特征高度一致。

5 实验验证:活性与机制深度解析

30条合成肽的抗菌实验显示:

  • 所有已知AMP进化肽均保持抗菌活性(MIC≤128μM)

  • SP进化肽成功率80%,随机序列进化肽成功率60%

  • R04肽展现卓越广谱活性(对革兰阳性菌效果更优)

    膜选择性机制通过分子动力学(MD)模拟验证:构建大肠杆菌内膜(含PE/PG脂质)和人血浆膜(POPC/POPE/SM/胆固醇)模型,6种高选择性指数(SI)肽均显示更高细菌膜相互作用比例(重原子接触距离<3.5?)。静电作用为主要驱动力——细菌膜负电荷密度显著高于人源膜。

6 进化路径分析:从随机序列到高效AMP的蜕变

以从头设计AMP R04(26残基α螺旋)为例,分析其进化路径:

  • 初始序列2-0(评分≈0)经E12位点突变(负电荷→正电荷)实现活性跃升

  • 保守突变位点包括M5、A8、A25,其中A8经历三步突变(M→E→R)

  • 实验测定路径所有序列MIC值与预测评分高度吻合(除2-7暂降)

    30天耐药性试验显示:环丙沙星(CIP)第8天即诱导耐药,而R04持续使用未引发耐药。

7 讨论与展望

AMPainter的创新性在于:统一了优化与生成双模式,突破序列设计空间限制(仅支持20种标准氨基酸单点替换),且进化路径可提供人工进化谱系(替代多重序列比对MSA)。当前局限包括:不支持插入/删除/非标准氨基酸操作,未整合毒性奖励(可结合ToxDL等预测器过滤)。未来需结合湿实验数据(如膜选择性测定)深化机制驱动设计。

8 实验方法精要

  • 数据构建:HyperAMP训练集含3265条AMP(来源PepVAE)及等量非AMP,奖励分数通过公式 ri=1/(1+10logMICi-2) 转换

  • 语言模型微调:Ankh-base在7316条非冗余AMP上微调(掩码率20%)

  • 进化序列筛选:已知AMP选择MIC>10μM者;SP去除含半胱氨酸/连续三同残基序列

  • MD模拟:CHARMM36m力场,500ns×3重复,膜模型按文献精确构建

  • 活性测定:遵循Hancock法,浓度梯度0.125-128μM,终点法判读MIC

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号