言语数字生物标志物联合血液生物标志物通过机器学习预测阿尔茨海默病认知障碍
《Alzheimer's Research & Therapy》:Speech digital biomarker combined with fluid biomarkers predict cognitive impairment through machine learning
【字体:
大
中
小
】
时间:2025年10月23日
来源:Alzheimer's Research & Therapy 8
编辑推荐:
本研究针对阿尔茨海默病(AD)早期检测成本高、侵入性强的问题,开发了一种结合言语数字标志物(PSD)、血清标志物(GFAP、p-Tau217等)和机器学习的高效筛查模型。研究证实PSD与认知水平、AD病理显著相关,构建的诊断模型AUC达0.928,Aβ状态预测模型AUC达0.845,为AD早期诊断提供了低成本、可推广的新方案。
随着全球人口老龄化加剧,阿尔茨海默病(Alzheimer's Disease, AD)已成为严峻的公共卫生挑战。这种神经退行性疾病如同一个"记忆小偷",悄无声息地侵蚀着患者的认知功能。然而,当前主流的诊断方法如脑脊液检测和淀粉样蛋白正电子发射断层扫描(Amyloid PET)不仅价格昂贵、具有侵入性,且在基层医疗机构难以普及。这就像拥有一把精准的钥匙,却因门锁过于复杂而无法打开早期诊断的大门。
正是在这样的背景下,上海交通大学医学院附属瑞金医院和仁济医院的研究团队将目光投向了人类最自然的交流方式——言语。早在明显的记忆衰退出现之前,AD患者的语言能力就可能出现微妙变化。研究人员发现,言语沉默时间百分比(Percentage of Silence Duration, PSD)这一指标在区分认知障碍患者和健康人群时展现出独特价值。但言语特征与AD病理变化之间的确切关系仍不明确,其临床应用缺乏病理学验证。
为了解开这个谜团,研究团队开展了一项大规模临床研究,成果发表在《Alzheimer's Research & Therapy》期刊上。他们招募了1223名参与者,包括238名AD患者、461名遗忘型轻度认知障碍(amnestic Mild Cognitive Impairment, aMCI)患者和524名认知正常(Cognitively Unimpaired, CU)的对照者。所有参与者均完成了"饼干盗窃"图片描述任务的语音录制,并接受了血清生物标志物检测、APOE基因分型和神经心理学评估,其中201人还接受了AV45淀粉样蛋白PET成像。
研究的关键技术方法包括:基于医院来源的认知障碍队列(MIMI cohort)和社区老年队列(She-Mountain aging cohort)的多中心样本收集;采用自动语音识别技术提取PSD等言语特征;使用单分子免疫检测(Single Molecular Immunity Detection, SMID)平台定量血清GFAP、NFL、Aβ40/Aβ42、p-Tau181和p-Tau217水平;通过AV45 PET/MR扫描评估脑内淀粉样蛋白沉积;应用XGBoost和逻辑回归等机器学习算法构建诊断预测模型。
Demographics,clinical characteristics,core AD fluid,digital and imaging biomarkers among groups
研究发现三组参与者在核心AD生物标志物上存在显著差异。AD患者的血清GFAP、NFL、p-Tau181和p-Tau217水平最高,认知正常组最低。值得注意的是,言语数字标志物PSD随着疾病进展逐渐升高,AD组显著高于认知正常组。APOE-ε4携带者在AD组中比例最高(37.39%),认知正常组最低(19.27%)。AV45 PET成像显示,淀粉样蛋白阳性组在各脑区的标准摄取值比(Standardized Uptake Value Ratio, SUVR)均显著高于阴性组。
Correlation of PSD with cognitive assessments, fluid biomarkers, and amyloid burden in the brain
PSD与认知水平、血清生物标志物和脑内淀粉样蛋白负荷均呈现显著相关性。PSD与蒙特利尔认知评估(MoCA)得分呈负相关(r=-0.3285, P<0.0001),与临床痴呆评定量表(CDR)评分呈正相关。在血清标志物方面,PSD与GFAP(r=0.0737, P=0.0108)、NFL(r=0.0603, P=0.0372)和p-Tau217(r=0.1208, P<0.0001)呈正相关,与Aβ42/Aβ40无显著相关性。更有趣的是,PSD与特定脑区如额叶(r=0.2042, P=0.0259)和颞叶(r=0.2111, P=0.0212)的淀粉样蛋白沉积呈正相关。
Combining digital and fluid markers to identify individuals with cognitive impairment
研究人员构建了认知障碍诊断模型,通过SHAP值引导的特征筛选,最终确定了最简且高效的模型,包含年龄、性别、教育年限、APOE基因型、PSD和GFAP。该模型在测试集中的AUC达到0.928(95%CI, 0.897-0.960),与包含所有特征的最佳模型无显著差异。PSD在所有参数中贡献度最大,GFAP在血清标志物中贡献最突出。
Combining digital and fluid markers to speculate on possible Aβ status
针对Aβ状态的预测,研究团队建立了逻辑回归模型,包含年龄、性别、教育年限、APOE基因型、PSD和p-Tau217。该模型AUC为0.845(95%CI, 0.783-0.907),其中p-Tau217贡献最大,APOE基因型和PSD也发挥重要作用。这一模型为无创推测脑内Aβ沉积状态提供了新方法。
本研究首次在大样本队列中验证了言语数字标志物PSD与AD核心病理生物标志物的关联。研究发现PSD与反映神经炎症的GFAP、轴突损伤的NFL以及tau蛋白磷酸化的p-Tau217均呈正相关,且与额叶、颞叶等关键脑区的淀粉样蛋白沉积相关。特别值得注意的是,PSD、p-Tau217和GFAP在淀粉样蛋白沉积过程中呈现两阶段变化模式:在Aβ meta SUVR<1.2时呈上升趋势,之后进入平台期。这一发现与AD生物标志物动态变化经典模型相符,提示这些指标对早期Aβ病理变化特别敏感。
研究构建的多模态融合模型为AD早期筛查提供了创新解决方案。与单纯依赖言语特征或血清标志物的模型相比,这种结合 demographic(人口统计学)、genetic(遗传)、digital(数字)和fluid(液体)生物标志物的方法,在保持高精度的同时大幅降低了成本。PSD作为易于获取的指标,在两个模型中均发挥关键作用,凸显了言语分析在AD早期诊断中的巨大潜力。
该研究的局限性包括单中心设计、样本来源地域限制、缺乏Tau PET影像数据以及横断面研究设计等。未来需要多中心、大样本、长期随访研究进一步验证,并拓展对方言和环境噪声的适应性。
总之,这项研究为AD早期诊断提供了一条低成本、易推广的新路径。通过结合言语分析和血液检测等便捷手段,有望在基层医疗和社区筛查中广泛应用,助力AD的早期发现和干预,对应对全球老龄化挑战具有重要意义。随着数字技术和人工智能的不断发展,这种融合多模态数据的诊断策略将为神经退行性疾病的防控开辟新的前景。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号