
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于深度强化学习的抗菌肽智能设计模型AMPainter:实现抗菌活性精准“绘制”与功能进化
【字体: 大 中 小 】 时间:2025年09月14日 来源:Advanced Science 14.1
编辑推荐:
本刊推荐:本研究创新性地开发了基于深度强化学习(DRL)的抗菌肽(AMP)设计框架AMPainter,成功整合了序列优化(已知AMP活性提升)与从头生成(de novo设计)双重任务。该模型通过策略网络定位突变位点、经微调蛋白质语言模型(Ankh)解码残基类型,并依托超图神经网络活性预测器(HyperAMP)进行迭代优化,实现在已知AMP、信号肽(SP)及随机序列三类底物中高效进化出高活性AMP(实验验证成功率最高达80%)。多项进化肽表现出128倍抗菌活性提升(MIC降低),且体内外实验验证其膜靶向特异性与低耐药性诱导潜力,为耐药菌感染防治提供了人工智能驱动的创新方案。
微生物耐药性问题日益严峻,每年导致超70万人死亡,预计2050年可能达千万。抗菌肽(AMP)因膜破坏机制和广谱抗菌特性,成为克服耐药性的理想候选药物。尽管现有数据库收录超过3万种AMP,但其在巨大序列空间中分布稀疏,需进一步探索。计算模型为AMP发现和优化提供了高效途径,现有方法可分为优化(提升已知AMP活性)和生成(从头设计)两类,但当前模型多针对特定场景开发,缺乏统一框架。定向进化案例启示我们:通过施加进化压力,可增强蛋白质原有功能或获得新能力。强化学习(RL)在蛋白质工程中展现出探索广阔序列空间(20L)的潜力,但其在从头序列设计中的应用仍受限。
AMPainter模型包含三个核心模块:策略网络(Policy Network)选择突变位点、微调蛋白质语言模型(Ankh)解码残基类型、以及抗菌活性预测器HyperAMP评估突变序列。其中HyperAMP采用多级超图神经网络(HGNN),将肽序列划分为2/3/4-gram片段构建超图,利用残基级节点特征(Ankh嵌入)和片段TF-IDF权重进行消息传递,最终 concatenate 多级嵌入进行回归预测。该模型在测试集上Pearson相关系数达0.9220±0.0009,RMSE为0.1631±0.0001,显著优于传统Transformer、CNN-LSTM等基线模型。
训练过程中,AMPainter采用REINFORCE算法进行策略梯度更新,每条序列经历8次迭代突变(平衡活性与多样性)。模型在40个训练周期中,平均奖励分数从0.26提升至0.78,验证了框架的有效性。特别值得注意的是,通过微调语言模型桥接突变解码,显著提升了进化效率(对比未微调版本和随机突变基线)。
在已知AMP优化任务中,AMPainter与10种主流方法(包括HydrAMP类比生成模式、EvoPlay、PEX、MCMC等)进行对比。使用200条未见AMP序列测试表明:
经MBC-Attention和AMP-READ模型评分,AMPainter进化序列抗菌活性分布显著优于对照组(p<0.001)
六种AMP分类器(AMPScannerV2、CAMPR4系列、MACREL、ampir)预测概率均值>0.9
序列多样性分析(Levenshtein距离)显示,Top50/100序列多样性居首
在Pg-AMP1片段优化实验中,AMPainter经5轮进化获得0.624的适应度分数,超越遗传算法(GA)和三种VAE模型,且进化序列呈现典型的两亲性螺旋结构(富含亮氨酸L和精氨酸R交替模式)。
模型在三种初始序列集上展现强大进化能力:
已知AMP优化:200条AMP经进化后,最佳序列评分显著提升(Δscore>0),实验验证A05肽对枯草杆菌MIC从16μM降至0.25μM(活性提升64倍)
信号肽(SP)转化:708条细菌信号肽经进化后,80%(8/10)实验验证成功获得AMP功能,且所有HC25值>128μM,显示优异膜选择性
随机序列从头设计:200条随机序列进化后,60%(6/10)成为功能性AMP,其中R04肽对四种细菌平均MIC仅2.88μM(对金黄色葡萄球菌MIC低至0.5μM)
进化序列氨基酸频率分析显示:阳性电荷残基(K/R)频率显著增加,阴性电荷残基(D/E)几乎完全被替换,疏水残基(L/I)占比提升,与天然AMP分布特征高度一致。
30条合成肽的抗菌实验显示:
所有已知AMP进化肽均保持抗菌活性(MIC≤128μM)
SP进化肽成功率80%,随机序列进化肽成功率60%
R04肽展现卓越广谱活性(对革兰阳性菌效果更优)
膜选择性机制通过分子动力学(MD)模拟验证:构建大肠杆菌内膜(含PE/PG脂质)和人血浆膜(POPC/POPE/SM/胆固醇)模型,6种高选择性指数(SI)肽均显示更高细菌膜相互作用比例(重原子接触距离<3.5?)。静电作用为主要驱动力——细菌膜负电荷密度显著高于人源膜。
以从头设计AMP R04(26残基α螺旋)为例,分析其进化路径:
初始序列2-0(评分≈0)经E12位点突变(负电荷→正电荷)实现活性跃升
保守突变位点包括M5、A8、A25,其中A8经历三步突变(M→E→R)
实验测定路径所有序列MIC值与预测评分高度吻合(除2-7暂降)
30天耐药性试验显示:环丙沙星(CIP)第8天即诱导耐药,而R04持续使用未引发耐药。
AMPainter的创新性在于:统一了优化与生成双模式,突破序列设计空间限制(仅支持20种标准氨基酸单点替换),且进化路径可提供人工进化谱系(替代多重序列比对MSA)。当前局限包括:不支持插入/删除/非标准氨基酸操作,未整合毒性奖励(可结合ToxDL等预测器过滤)。未来需结合湿实验数据(如膜选择性测定)深化机制驱动设计。
数据构建:HyperAMP训练集含3265条AMP(来源PepVAE)及等量非AMP,奖励分数通过公式 ri=1/(1+10logMICi-2) 转换
语言模型微调:Ankh-base在7316条非冗余AMP上微调(掩码率20%)
进化序列筛选:已知AMP选择MIC>10μM者;SP去除含半胱氨酸/连续三同残基序列
MD模拟:CHARMM36m力场,500ns×3重复,膜模型按文献精确构建
活性测定:遵循Hancock法,浓度梯度0.125-128μM,终点法判读MIC
生物通微信公众号
知名企业招聘