
-
生物通官微
陪你抓住生命科技
跳动的脉搏
AllerTrans:基于深度学习和蛋白质语言模型的变应原性预测新方法
【字体: 大 中 小 】 时间:2025年07月10日 来源:Biology Methods and Protocols 2.5
编辑推荐:
为解决重组蛋白药物安全性评估中变应原性检测成本高、耗时长的问题,研究人员开发了基于深度学习的AllerTrans预测模型。该研究创新性地融合两种蛋白质语言模型(pLM)提取特征,通过深度神经网络实现分类,最终集成模型的灵敏度达97.91%,特异性达97.69%,ROC曲线下面积达99%,为变应原性预测提供了高效可靠的生物信息学工具。
在生物医药领域,变应原性(allergenicity)评估是重组蛋白(recombinant proteins)临床应用前的关键安全指标。传统实验室检测方法不仅耗费资源,且难以应对日益增长的蛋白药物开发需求。AllerTrans研究团队另辟蹊径,将前沿的蛋白质语言模型(protein language models, pLM)与深度学习技术相结合,开创性地构建了双通道特征提取架构——通过两种不同的pLM分别生成蛋白质序列的特征向量(feature vectors),再输入深度神经网络(deep neural network)进行精准分类。
该模型的创新之处在于特征融合(feature fusion)策略,不同pLM提取的互补性特征使分类性能显著提升。研究采用五折交叉验证(5-fold cross-validation)评估体系,最终集成模型交出了惊艳的成绩单:灵敏度(sensitivity)97.91%、特异性(specificity)97.69%、准确率(accuracy)97.80%,尤其是受试者工作特征曲线(ROC curve)下面积(AUC)高达99%,这些指标均超越现有预测工具。
目前,该团队已在Hugging Face平台部署了用户友好的网页工具,研究者只需输入蛋白质序列即可快速获得变应原性预测结果。这项研究为蛋白质安全性评估提供了新的范式(paradigm),特别是对加速新型生物制剂的临床转化具有重要价值。
生物通微信公众号
知名企业招聘