
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于深度学习的纵向方法预测阿尔茨海默病认知状态:实现3-10年长程精准预测的创新模型与临床价值
【字体: 大 中 小 】 时间:2025年09月26日 来源:Alzheimer's & Dementia 11.1
编辑推荐:
本研究创新性地利用深度学习技术,首次实现对阿尔茨海默病(AD)及遗忘型轻度认知障碍(aMCI)的3-10年长程预测。通过开发新型线性注意力插补法和特征分离建模策略,在NACC数据库上实现控制组81.65%、aMCI组72.87%、AD组86.52%的一对多准确率,为早期干预提供了突破性时间窗口。
阿尔茨海默病(AD)的早期预测主要集中在1-3年的短期预测,而本研究旨在开发新的机器学习技术,将认知状态的预测时间扩展到最后一次访视后的3-10年。遗忘型轻度认知障碍(aMCI)作为AD的前驱阶段,在此阶段的早期识别和干预尤为重要,因为在此阶段延缓或阻止AD进展更为容易。AD病理在aMCI症状出现前数年就已开始,因此对未来aMCI和AD发病的稳健预测对于在临床症状出现前进行干预至关重要。
研究使用国家阿尔茨海默病协调中心统一数据集3.0版(NACC UDS v3.0),筛选出30,750名参与者,包括始终认知正常者(19,743名)和最终发展为AD者(11,007名)。排除非AD痴呆患者,并确保样本间时间跨度为3-10年。通过数据平衡和增强过程,最终数据集包含25,179名患者,每类(控制、aMCI、AD)8,393个样本。
数据增强过程中,利用患者多次访视数据生成多个训练样本,例如使用患者前t-1次访视预测第t次认知状态。这种增强方法显著增加了训练样本量,提高了模型的泛化能力。
研究选取了两组特征:神经心理学数据(认知特征集)和神经心理学数据结合患者病史数据(联合特征集)。排除总结性指标(如CDR、GDS),允许模型从原始特征中学习关系。所有特征均经过标准化处理,生成“基线”特征和“变化”特征,分别表示相对于控制人群的标准化值和相对于首次访视的变化比率。
提出了两种插补方法:传统的基于Transformer的注意力插补和新型线性注意力插补。线性注意力方法将缺失值设为-1,通过简单的线性投影和加权平均处理缺失数据,显著减少了参数数量并提高了计算效率。
采用分离架构处理“基线”和“变化”特征。使用Transformer或线性注意力编码“基线”特征,使用LSTM编码“变化”特征。通过门控机制(δ)融合两种编码,最终通过前馈神经网络进行分类预测。模型使用交叉熵损失进行训练,采用Adam优化器和权重衰减技术。
通过10折交叉验证确定最佳超参数。线性注意力模型在隐藏层大小为2048、学习率为5×10-6时表现最佳;Transformer模型在隐藏层大小为512、学习率为5×10-5时表现最佳。所有实验使用NVIDIA RTX A5000 GPU进行。
线性注意力模型在联合特征集上表现最佳,总体准确率达到70.53±1.12%,一对一多AUC为86.01±0.72%。控制组、aMCI组和AD组的一对一多准确率分别为81.68±0.82%、72.87±0.95%和86.52±0.69%。
包含患者病史信息的联合特征集在大多数指标上优于仅使用认知特征集的模型,表明病史信息对长程预测具有重要价值。
混淆矩阵显示,大多数错误发生在控制组与aMCI组之间以及aMCI组与AD组之间,表明aMCI的预测仍然具有挑战性。
本研究首次实现了AD和aMCI的3-10年长程预测,在不使用总结性指标的情况下取得了与短期预测相当的性能。线性注意力插补法在参数效率和处理缺失数据方面表现出优势。特征分离策略有效捕捉了个体内变异信息,提高了预测准确性。
尽管在控制组和AD组的预测上取得了较高准确率,aMCI的预测仍然较为困难。未来研究可探索个体化轨迹预测、动态时间规整等方法来进一步提高aMCI的预测性能。此外,由于输入序列相对较短,LSTM可能不是最有效的解决方案,未来可研究更高效的时序架构,如流匹配等技术。
本研究为使用大数据技术进行痴呆症纵向分析提供了新的方法学基础,为AD的早期干预提供了新的时间窗口和工具。通过延长预测时间范围,为临床干预提供了更为充裕的时间,具有重要的临床意义和应用价值。
生物通微信公众号
知名企业招聘