基于深度学习的T细胞受体特征预测自身免疫性疾病:AutoY与LSTMY模型的创新应用

【字体: 时间:2025年02月08日 来源:Scientific Reports 3.8

编辑推荐:

   编辑推荐:本研究针对自身免疫性疾病(如RA、T1D、MS、IAA)诊断难题,开发了基于卷积神经网络(AutoY)和双向LSTM(LSTMY)的TCR(T细胞受体)预测模型。实验显示,AutoY在T1D和MS预测中AUC分别达0.99和0.996,显著优于传统方法,为无创检测提供新工具。成果发表于《Scientific Reports》,推动AI在免疫诊疗中的应用。

  

论文解读

自身免疫性疾病如同一场“友军误伤”,免疫系统错误攻击自身组织,导致类风湿性关节炎(RA)、1型糖尿病(T1D)等复杂疾病。全球患者数量激增,但病因涉及遗传、环境、免疫细胞异常等多因素,诊断和治疗面临巨大挑战。T细胞作为免疫系统的核心,其表面T细胞受体(TCR)的异常激活与疾病密切相关,尤其是CDR3区(互补决定区3)直接决定抗原结合特异性。然而,传统方法难以捕捉TCR序列的复杂模式,亟需智能算法突破预测瓶颈。

景德镇陶瓷大学信息工程学院的研究团队在《Scientific Reports》发表研究,提出两种深度学习模型——基于卷积神经网络的AutoY和融合注意力机制的双向LSTM模型LSTMY,通过分析TCR序列预测四种自身免疫性疾病。结果显示,AutoY在T1D和MS预测中AUC分别高达0.9991和0.9961,性能显著优于LSTMY,为临床无创检测提供新范式。

关键技术方法
研究从Adaptive Biotechnologies免疫数据库获取TCR-seq数据,涵盖RA(86例)、T1D(104例)、MS(174例)、IAA(65例)及健康对照(214例)。预处理包括长度筛选(10-24氨基酸)、IMGT标准过滤和克隆频率排序。采用多实例学习(MIL)框架,将TCR序列集视为“实例包”,通过PCA降维的20×15氨基酸特征矩阵编码序列。AutoY设计多尺寸卷积核(2-5)提取CDR3区域特征,LSTMY则通过双向LSTM层和自注意力机制捕获长程依赖,均使用Adam优化器和早停策略训练。

研究结果

AutoY模型分析
AutoY在T1D和MS预测中表现突出:AUC分别为0.9991±0.0034和0.9961±0.0083,准确率>97%。热图显示MS患者TCR克隆重复数达3.7259,与健康组差异显著,模型易捕捉特征;而T1D虽克隆重复数接近健康组(约1),模型仍能精准识别,表明其强泛化能力。对IAA和RA预测稍弱(AUC 0.9750和0.9375),主因样本量小(IAA仅65例)及RA的TCR多样性过高。

LSTMY模型分析
LSTMY在MS预测中AUC达0.9963±0.0022,稳健性优于AutoY(置信区间更窄)。但对RA敏感性仅0.5540,因RA样本中44%患者预测值低于阈值,反映模型对阳性样本识别不足。小提琴图显示,两类模型均对健康样本特异性>93%,但RA/IAA的阳性样本预测值分散,提示特征学习不充分。

讨论与意义
该研究首次将深度学习系统应用于自身免疫病TCR预测,突破传统方法局限。AutoY通过局部卷积高效提取CDR3高频特征,而LSTMY的长序列建模优势为复杂疾病提供补充视角。局限性在于RA/IAA样本不足和潜在混杂因素(如MS样本同质性高)。未来需扩大样本、优化特征工程,或结合HLA(人类白细胞抗原)等遗传标记提升性能。

成果为AI驱动免疫诊疗树立标杆:TCR库的无创检测可加速疾病早筛,个体化疫苗设计成为可能。正如研究者指出,“模型对T1D/MS的卓越性能,印证了TCR特征在自身免疫中的关键作用”。这一跨学科探索为破解免疫误攻之谜开辟了新路径。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号