
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于自进化异质图学习的抗菌肽-微生物关联预测模型AEPMA:精准靶向耐药菌治疗新策略
【字体: 大 中 小 】 时间:2025年07月10日 来源:Briefings in Bioinformatics 6.8
编辑推荐:
针对抗生素耐药性问题,华中科技大学与安徽大学团队开发了基于自进化异质图学习框架AEPMA,通过构建肽-微生物-疾病网络(PMDHAN)和动态信息聚合机制,实现了对特定微生物靶向抗菌肽(AMPs)的精准预测。实验表明AEPMA在四个数据集上AUC达0.989,并成功鉴定出抗金黄色葡萄球菌和大肠杆菌的新型抗菌肽,为耐药菌治疗提供了新思路。
抗生素滥用导致的多重耐药菌问题日益严峻,传统抗生素研发陷入瓶颈。抗菌肽(AMPs)因其独特的膜破坏机制和不易诱发耐药性的特点,成为最具潜力的替代方案。然而现有计算方法多停留在识别具有广谱抗菌活性的肽类,缺乏针对特定病原微生物的精准预测能力,这严重制约了AMP药物的临床转化效率。
华中科技大学人工智能与自动化学院和安徽大学智能计算与信号处理教育部重点实验室的研究团队在《Briefings in Bioinformatics》发表研究,提出基于自进化异质图学习的肽-微生物关联(PMA)预测框架AEPMA。该研究创新性地构建了包含4050种肽、131种微生物和161种疾病的肽-微生物-疾病异质网络(PMDHAN),通过动态信息聚合机制实现了对微生物特异性抗菌肽的高精度预测,AUC值达0.989,较现有最优方法提升2.4%。
关键技术包括:1)整合DBAASP和Disbiome数据库构建PMDHAN网络;2)采用Smith-Waterman算法计算肽序列相似度;3)基于随机游走(RWR)的节点特征编码;4)自进化异质图设计,动态选择"微生物→肽"等9类信息聚合路径;5)双层次优化框架同步优化网络参数与传播模式概率。
【Construction of the peptide-microbe-disease network】
研究从DBAASP数据库筛选4050条非冗余抗菌肽序列,通过CD-HIT去除70%相似度的冗余序列,最终建立16205对肽-微生物关联。结合Disbiome数据库的670对微生物-疾病关联,构建包含肽序列相似性、微生物高斯核相似度的多维网络。
【Encoding for peptides, microbes, and diseases】
采用随机游走(RWR)算法提取节点初始特征,设置重启概率0.2,通过80步随机游走捕获网络拓扑特征,生成具有可比性的概率分布向量作为节点嵌入。
【Autoevolutionary message passing mechanism】
创新性提出时间戳跳跃结构:在9种可能的信息聚合模式(如eMP表示"微生物→肽")中动态选择最优路径,通过GCN实现跨时间戳特征传播。最终时间戳强制约束为"*→肽/微生物"模式,显著提升目标预测特异性。
【Performance evaluation】
在PMDHAN数据集上,AEPMA的AUC(0.989)和AUPRC(0.989)均显著优于GCNMDA等5种对比模型。即使删除30%网络边或负样本比例增至1:10,性能波动不足3%,显示强鲁棒性。边缘频率分析揭示"微生物→肽"路径贡献度最高(2%)。
【Cold start analysis】
对关联数≤10的"冷启动"微生物,预测精度保持0.966 AUC,较次优模型高3.8%。跨数据集测试在MDAD、aBiofilm和Virus数据集分别达到0.981、0.987和0.971 AUC,证实优异泛化能力。
【Prediction validation】
实验验证发现抗金黄色葡萄球菌肽WLRRIKAWLRRKRK(logMIC 0.820μM)和抗大肠杆菌肽KLKKLLKRWRRWWR(logMIC 0.829μM),分子对接显示其通过两亲性结构靶向微生物膜。
该研究突破了传统AMP预测的广谱性局限,首创微生物特异性的关联预测框架。自进化机制克服了传统元路径依赖先验知识的缺陷,动态适应不同网络结构。提出的PMDHAN网络为多组学数据整合提供新范式,鉴定出的特效肽为临床耐药菌治疗提供了候选分子。未来可通过预训练模型增强对新肽的泛化能力,进一步推动精准抗感染治疗发展。
生物通微信公众号
知名企业招聘