基于神经精神症状和神经心理学特征的机器学习模型在阿尔茨海默病与行为变异型额颞叶痴呆鉴别诊断中的价值

【字体: 时间:2025年10月23日 来源:Alzheimers & Dementia 11.1

编辑推荐:

  本研究利用美国国家阿尔茨海默病协调中心(NACC)的尸检确诊队列,开发了四种机器学习(ML)模型(逻辑回归、支持向量机、随机森林、人工神经网络),仅基于初次就诊的神经精神症状清单(NPI-Q)和神经心理学测试数据,即可有效区分阿尔茨海默病(AD)与行为变异型额颞叶痴呆(bvFTD)。所有模型均表现出高区分度(AUC 0.89-0.95),冷漠、脱抑制和数字符号替换测试(DSST)是关键鉴别特征。该研究为利用临床可及指标进行AD与bvFTD的精准鉴别诊断提供了有力工具。

  
研究背景与挑战
阿尔茨海默病(AD)和行为变异型额颞叶痴呆(bvFTD)是两种常见的神经退行性疾病,在疾病早期,尤其是在初次就诊时,其临床表现存在显著重叠,导致鉴别诊断极具挑战性。临床误诊率较高,这不仅影响患者的预后评估,也阻碍了针对性治疗和临床试验的入组。尽管神经影像学和生物标志物检测能提高诊断准确性,但其可及性和成本限制了广泛应用。因此,开发基于临床可及信息(如神经精神症状和神经心理学评估)的精准、客观的辅助诊断工具具有重要的临床意义。
研究设计与方法
本研究利用了来自美国国家阿尔茨海默病协调中心(NACC)数据库的大规模、前瞻性收集的数据。研究队列由尸检神经病理学确诊的病例组成,确保了诊断的“金标准”可靠性。最终分析样本包括1616名参与者,其中AD组1498人,bvFTD组118人。研究人员从参与者的初次就诊记录中提取了两类核心临床数据:一是神经精神症状清单-问卷(NPI-Q)评估的12个神经精神症状域(如冷漠、脱抑制、焦虑等)的严重程度;二是一套标准神经心理学测验的成绩,涵盖了记忆、语言、执行功能、注意力等多个认知领域,具体包括连线测验A、B部分(TMT-A, TMT-B)、数字符号替换测试(DSST)、类别流畅性、命名、故事记忆、数字广度等。此外,整体认知功能通过简易精神状态检查(MMSE)或蒙特利尔认知评估(MoCA)进行衡量。
为了应对数据缺失问题,研究采用了多重插补法生成五个完整数据集。研究的核心是构建并比较四种不同的机器学习(ML)模型来区分AD和bvFTD:
  1. 1.
    逻辑回归(LR):一种经典的线性模型,易于解释。
  2. 2.
    支持向量机(SVM):通过寻找最优超平面来区分两类数据,适用于线性和非线性问题。
  3. 3.
    随机森林(RF):一种集成学习算法,通过构建多棵决策树并综合其结果来提高预测精度和稳健性,并能评估特征重要性。
  4. 4.
    人工神经网络(ANN):一种受大脑结构启发的深度学习模型,能够捕捉特征之间复杂的非线性关系。
针对AD和bvFTD样本量不均衡(类别不平衡)的问题,研究采用了合成少数类过采样技术(SMOTE)和调整类别权重等策略,以确保模型不会偏向于多数类(AD),从而提高对少数类(bvFTD)的识别能力。模型性能通过准确度、敏感性、特异性、F1分数以及受试者工作特征曲线下面积(AUC)等指标进行全面评估。
研究人群特征与临床表型差异
分析显示,bvFTD组参与者比AD组更年轻,且确诊为痴呆的比例更高,这与这两种疾病的典型发病年龄和病程特征相符。在神经精神症状方面,bvFTD组的NPI-Q总分显著高于AD组,表明其行为和精神症状总体更为严重。具体而言,焦虑是AD组中最常报告的症状,而冷漠/漠不关心和脱抑制则是bvFTD组最突出且最常见的症状。在认知表现上,bvFTD组在故事记忆(延迟回忆)测试中的表现优于AD组,这反映了AD典型的遗忘症状。然而,bvFTD组在类别流畅性(语义检索)和命名测试中的表现则差于AD组,提示可能存在语言和执行功能方面的损害。值得注意的是,尽管存在这些特定领域的差异,两组的整体认知功能(MMSE/MoCA评分)没有显著差异,凸显了仅凭整体认知筛查难以区分二者,而详细领域特异性评估至关重要。
机器学习模型性能卓越
所有四种机器学习模型在区分尸检确诊的AD和bvFTD方面均表现出色。
  • 逻辑回归模型表现最佳,准确率达到88%,敏感性为91%,特异性为88%,AUC高达0.95。
  • 支持向量机模型同样显示出高判别力,准确率为87%,敏感性83%,特异性87%,AUC为0.91。
  • 随机森林模型人工神经网络模型也取得了良好的结果,AUC分别为0.89和0.89。
这些结果证实了,结合神经精神症状和神经心理学数据的机器学习方法,能够在初次就诊时有效辅助鉴别AD和bvFTD,其性能与或优于以往部分基于更复杂数据(如神经影像)的研究。
识别关键鉴别特征:冷漠、脱抑制与处理速度
通过分析不同模型中的特征重要性,研究发现了对区分AD和bvFTD贡献最大的临床指标。尽管不同模型计算特征重要性的方法不同(如逻辑回归的系数、随机森林的基尼重要性、神经网络的SHAP值),但几个特征 consistently 脱颖而出:
  1. 1.
    冷漠/漠不关心(Apathy/Indifference):这是bvFTD的核心特征之一,在多个模型中都是最重要的预测因子之一。它表现为目标导向的行为、认知和情感的减少。
  2. 2.
    脱抑制(Disinhibition):另一个bvFTD的标志性特征,包括社会行为失当、冲动等,对鉴别诊断具有高度特异性。
  3. 3.
    数字符号替换测试(DSST):这项测试涉及处理速度、视觉运动协调和注意力,是神经心理学评估中一个重要的鉴别指标。
此外,类别流畅性和故事记忆也在某些模型中显示出重要性。这些发现强调了在临床评估中,系统性地评估行为症状(特别是冷漠和脱抑制)并结合特定的神经心理学测验(如DSST)对于提高鉴别诊断准确性具有极高价值。
误分类病例分析:揭示不典型表现
研究还对被模型错误分类的bvFTD病例(假阴性)进行了分析。这些被误判为AD的bvFTD患者通常表现出“非典型”的临床特征,例如总体神经精神症状严重程度较低、焦虑症状更常见,并且故事记忆成绩更差,使其临床表现更接近于AD的典型模式。这一发现说明,对于临床表现不典型的患者,可能需要更加警惕,并考虑使用脑脊液生物标志物或分子影像学等更精确的检测手段来辅助诊断。
研究意义与展望
本研究的优势在于使用了大规模、尸检确诊的队列,确保了诊断的准确性,并系统比较了多种机器学习算法。研究结果表明,利用初次就诊时常规收集的神经精神症状和神经心理学数据,机器学习模型能够以较高的准确度区分AD和bvFTD。研究识别出的关键临床特征(如冷漠、脱抑制、DSST)是易于获取、成本效益高的潜在生物标志物,具有重要的临床转化潜力。
未来研究可在更大、更平衡的样本中验证这些模型,并探索将社会认知评估等对bvFTD鉴别非常重要的维度纳入模型。此外,将此类模型应用于鉴别bvFTD与原发性精神疾病(如抑郁症、双相情感障碍)也是一个重要的方向。最终,这些工具有望集成到临床决策支持系统中,帮助神经科医生和老年精神科医生进行更早期、更准确的诊断,从而为患者提供更合适的治疗和管理方案。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号