
-
生物通官微
陪你抓住生命科技
跳动的脉搏
AI驱动的物种感知语言模型在抗菌肽发现与优化中的突破性应用
【字体: 大 中 小 】 时间:2025年07月19日 来源:Briefings in Bioinformatics 6.8
编辑推荐:
本研究针对抗生素耐药性这一全球健康挑战,创新性地开发了LLAMP(Large Language model for AMP activity prediction)模型,通过整合蛋白质语言模型与细菌基因组特征,实现了对45种病原体的物种特异性抗菌肽(AMP)活性预测(PCC=0.735)。团队筛选550万肽段发现肽13(选择性最佳)和肽16(效力最强),经Trp/Lys/Phe关键位点改造获得肽13-5,其抗菌活性与临床候选肽pexiganan相当。该研究为AI加速新型抗生素开发提供了范式。
随着"后抗生素时代"威胁迫近,世界卫生组织已将耐药菌株的蔓延列为全球健康危机。传统抗生素研发周期长、成本高,而抗菌肽(Antimicrobial Peptides, AMPs)因其多重作用机制和低耐药性特点成为研究热点。然而,通过传统实验方法从海量肽序列中筛选有效AMP犹如大海捞针,亟需创新方法突破这一瓶颈。
光州科学技术院(GIST)的Daehun Bae和Minsang Kim等研究人员开发了LLAMP模型,这是首个整合物种基因组特征的AMP预测系统。该研究通过AI筛选获得选择性媲美omiganan的肽13和效力比肩pexiganan的肽16,相关成果发表于《Briefings in Bioinformatics》。
研究团队运用三大关键技术:1)基于ESM-2架构的蛋白质语言模型,通过1.7百万肽序列预训练实现肽语言解析(PPPL=14.0);2)融合340维细菌k-mer基因组特征构建物种感知预测系统;3)利用注意力机制解析关键氨基酸(如Trp10、Lys16),指导肽13的理性改造。实验验证采用UPLC-MS纯化肽段,通过圆二色谱(CD)分析膜环境依赖性构象变化,结合硝基头孢菌素(nitrocefin)和碘化丙啶(PI)双膜破坏实验验证机制。
通过掩码语言建模(MLM)准确率提升至82.4%(原始模型76.1%),UMAP可视化显示预训练后氨基酸嵌入呈现理化性质聚类。模型对35种训练菌株的MIC预测PCC达0.735,在10种未见菌株中仍保持0.668的相关性,显著优于AMPScannerV2等现有工具(ACC 90.53% vs 87.45%)。
在ESKAPEE病原体测试集上,LLAMP的PCC(0.805)超越ESKAPEE-MICpred(0.802)。消融实验证实基因组分支(PCC下降0.12)和肽预训练(PCC下降0.05)对性能的关键作用。对李斯特菌等低数据菌株的预测局限提示数据多样性需求。
从550万肽段中筛选出7个候选,肽16对大肠杆菌(E. coli)和金黄色葡萄球菌(S. aureus)的MIC达3.1μM,溶血活性(Hmax 29.9%)仅为pexiganan的一半。肽13对鲍曼不动杆菌(A. baumannii)的MIC<3.1μM,选择性指数>15.9。
基于注意力热点设计肽13-5(W6/W13取代),其α-螺旋含量在细菌膜环境(POPE:POPG)中提升42%,对铜绿假单胞菌(P. aeruginosa)的MIC从25μM降至6.3μM,但溶血活性升至111.7μM。CD谱显示其与pexiganan相似的膜依赖性构象转换特性。
硝基头孢菌素实验证实肽16能破坏70%外膜,PI摄取显示其内膜渗透性较弱。肽13-5则表现出均衡的双膜破坏能力,这与AlphaFold2预测的两亲性指数提升(ΔμH=0.38)相符。
这项研究开创性地将物种基因组特征与深度学习相结合,解决了AMP发现中"活性-选择性"平衡的难题。通过注意力机制解析的Trp/Lys/Phe关键位点为理性设计提供了新范式。尽管对低丰度菌株预测存在局限,但LLAMP框架可扩展至真菌、病毒等病原体,其开源代码(GitHub/GIST-CSBL/LLAMP)将加速抗感染药物研发。该成果为应对ESKAPEE等"超级细菌"威胁提供了AI驱动的解决方案,标志着计算生物学向精准抗菌治疗迈出关键一步。
生物通微信公众号
知名企业招聘