编辑推荐:
为解决阿尔茨海默病(AD)进展分类中脑区、人口统计学及蛋白病具体贡献不明的问题,研究人员利用 ADNI 数据,开展基于机器学习预测 AD 进展的研究。结果显示不同特征在疾病分类和进展预测中作用各异。这为理解 AD 发展轨迹提供新视角。
在人口老龄化加剧的当下,阿尔茨海默病(AD)已成为全球关注的重大健康难题。这种疾病不仅严重影响患者的认知功能和生活质量,还给家庭和社会带来沉重负担。目前,AD 的早期诊断和病情进展预测面临诸多挑战。虽然结构脑完整性与认知能力密切相关,但在轻度认知障碍(MCI)和 AD 痴呆阶段,健康与病理变化的区分并不清晰,且年龄相关变化呈连续状态,使得理解其发展轨迹困难重重。同时,尽管已有研究利用机器学习对 AD 进行分类,但纵向分析较少,且对于分类中各特征的具体贡献,尤其是脑区、人口统计学因素和蛋白病方面,仍知之甚少。为了攻克这些难题,来自德国吕贝克大学(University of Lübeck)的 Marthe Mieling、Mushfa Yousuf、Nico Bunzeck 等研究人员,携手阿尔茨海默病神经影像学倡议组织(Alzheimer’s Disease Neuroimaging Initiative,ADNI),开展了一项极具意义的研究。他们的研究成果发表在《GeroScience》杂志上,为我们深入了解 AD 进展提供了新的方向。
研究人员运用了多种关键技术方法。数据来源于 ADNI 数据库,该数据库包含丰富的临床和影像资料。研究纳入认知正常(CN)、MCI 和 AD 痴呆患者,依据严格诊断标准进行分组。利用 FreeSurfer 软件处理 MRI 数据,获取脑区体积和厚度信息。通过检测脑脊液(CSF)中的淀粉样蛋白 -β(Aβ)和磷酸化 tau(pTau)水平,评估蛋白病状态。同时,对载脂蛋白 E(APOE)进行基因分型。采用极端梯度提升(XGBoost)算法构建分类模型,并借助 SHapley 可加性解释(SHAP)值分析各特征贡献。
诊断与神经心理学测试结果
研究人员对神经心理学评估进行了单因素协方差分析(ANCOVA),并校正了年龄、性别和教育程度。在横断面分析 1 中,CN、MCI 和 AD 痴呆组之间存在显著差异,MCI 和 AD 痴呆患者的认知表现明显较低。在纵向分析 2 中,CN - 转 MCI(CN - to - MCI)的患者平均在 15 个月后发生转换,CN 稳定组则平均稳定 70.54 个月,CN - 转 MCI 组在 ADNI 记忆测试 1(MEM 1)和阿尔茨海默病评估量表认知部分(ADAS - Cog 13)得分较低。在纵向分析 3 中,MCI - 转 AD(MCI - to - AD)的患者平均 9.53 个月后发生转换,MCI 稳定组平均稳定 52.5 个月,MCI - 转 AD 组在所有神经心理学评估中的得分均低于 MCI 稳定组。
ADNI 数据集分类结果
在分析 1(CN vs MCI vs AD 痴呆)中,XGBoost 模型的整体准确率达到 71%,CN、MCI 和 AD 痴呆的 F1 分数分别为 76%、55% 和 83%。SHAP 分析显示,CSF 状态、海马体体积和内嗅皮层厚度是最重要的预测特征。在分析 2(CN 稳定 vs CN - 转 MCI)中,模型准确率为 76%,CN 稳定组和 CN - 转 MCI 组的 F1 分数分别为 76% 和 75%。海马体体积、岛叶厚度和颞上回厚度是关键预测特征,且 CN - 转 MCI 组这些脑区的值更低。在分析 3(MCI 稳定 vs MCI - 转 AD)中,包含 CSF 数据时,模型准确率为 77%,MCI 稳定组和 MCI - 转 AD 组的 F1 分数分别为 80% 和 74%;不包含 CSF 数据时,准确率为 70%,F1 分数分别为 71% 和 69%。内嗅皮层厚度、CSF 状态(包含 CSF 数据时)、杏仁核体积以及楔叶体积(不包含 CSF 数据时)是重要预测特征,MCI - 转 AD 组中这些脑区特征值更低,CSF 状态值更高。
研究表明,机器学习结合结构 MRI 数据、社会人口学信息、CSF 状态和遗传信息,能够对 AD 连续体进行精确且可解释的分类。海马体在从健康老化到 MCI 的转换中起重要作用,内嗅皮层则在从 MCI 到 AD 痴呆的转换中贡献更大。这一发现为 AD 的早期诊断和干预提供了新的依据,有助于开发更有效的治疗策略,对推动 AD 研究和临床实践意义重大。然而,研究也存在一定局限性,如部分分析样本量较小,部分脑区量化不够精确等。未来研究可进一步扩大样本量,优化特征选择,结合更多临床和影像数据,以提升对 AD 的认识和诊疗水平。