
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多模态深度学习的癌症相关T细胞受体序列预测方法:融合空间结构与序列特征的并行残差模型
【字体: 大 中 小 】 时间:2025年09月21日 来源:Engineering Applications of Artificial Intelligence 8
编辑推荐:
本综述创新性地提出融合空间结构与序列特征的多模态深度学习模型MDPR,通过坐标热编码(coordinate-hot)和高维词向量技术突破传统TCR序列预测局限,在癌症相关TCR-seq识别中实现AUC达0.971的卓越性能,为癌症免疫诊断与治疗提供新范式。
亮点 (Highlights)
MDPR采用并行残差结构的多模态深度学习框架,有效整合TCR序列的空间结构与序列特征
创新性提出基于原子三维空间坐标的坐标热编码(coordinate-hot)方法
使用高维词向量替代传统氨基酸特征向量,增强时序特征提取能力
通过空间特征提取模块预训练与联合训练策略提升多模态融合效果
材料与预处理方法 (Materials and preprocessing method)
本节详细介绍了MDPR模型所使用的数据集、数据预处理流程及模型架构设计。通过原子级三维空间坐标与独热编码的融合,构建了能够同时保留空间构象和序列信息的新型编码体系。
实验 (Experiments)
通过多维度验证实验,本节系统评估了MDPR的各项性能指标,并与当前最先进方法进行对比分析。实验采用十轮三重交叉验证,最终在癌症相关TCR-seq识别任务中达到0.971的AUC值,较现有最佳方法提升5%。
讨论 (Discussion)
本研究证明了MDPR在预测癌症相关TCR-seq方面的卓越性能,其成功关键在于有效融合TCR序列的双模态特征。通过坐标热预处理方法,模型能够高效提取TCR序列的空间结构特征;结合迁移学习策略和并行架构卷积神经网络,模型同时实现了对TCR序列特征的深度挖掘。预训练与联合训练策略的协同应用,显著增强了模型对多模态关联性的认知能力。
结论 (Conclusion)
本文提出的MDPR创新性方法通过有效捕捉TCR-seq的空间与序列特征,实现了对癌症相关TCR-seq的精准预测。该模型采用坐标热编码方法处理TCR-seq的原子空间坐标,并通过具有残差结构的空间特征提取模块挖掘空间结构特征(第4.2节已验证其有效性)。在氨基酸序列处理方面,采用高维词向量技术替代传统特征向量,显著提升了对T细胞受体时序特征的提取能力。
生物通微信公众号
知名企业招聘