AllerTrans:基于深度学习和蛋白质语言模型的变应原性预测新方法

【字体: 时间:2025年07月10日 来源:Biology Methods and Protocols 2.5

编辑推荐:

  为解决重组蛋白药物安全性评估中变应原性检测成本高、耗时长的问题,研究人员开发了基于深度学习的AllerTrans预测模型。该研究创新性地融合两种蛋白质语言模型(pLM)提取特征,通过深度神经网络实现分类,最终集成模型的灵敏度达97.91%,特异性达97.69%,ROC曲线下面积达99%,为变应原性预测提供了高效可靠的生物信息学工具。

  

在生物医药领域,变应原性(allergenicity)评估是重组蛋白(recombinant proteins)临床应用前的关键安全指标。传统实验室检测方法不仅耗费资源,且难以应对日益增长的蛋白药物开发需求。AllerTrans研究团队另辟蹊径,将前沿的蛋白质语言模型(protein language models, pLM)与深度学习技术相结合,开创性地构建了双通道特征提取架构——通过两种不同的pLM分别生成蛋白质序列的特征向量(feature vectors),再输入深度神经网络(deep neural network)进行精准分类。

该模型的创新之处在于特征融合(feature fusion)策略,不同pLM提取的互补性特征使分类性能显著提升。研究采用五折交叉验证(5-fold cross-validation)评估体系,最终集成模型交出了惊艳的成绩单:灵敏度(sensitivity)97.91%、特异性(specificity)97.69%、准确率(accuracy)97.80%,尤其是受试者工作特征曲线(ROC curve)下面积(AUC)高达99%,这些指标均超越现有预测工具。

目前,该团队已在Hugging Face平台部署了用户友好的网页工具,研究者只需输入蛋白质序列即可快速获得变应原性预测结果。这项研究为蛋白质安全性评估提供了新的范式(paradigm),特别是对加速新型生物制剂的临床转化具有重要价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号