
-
生物通官微
陪你抓住生命科技
跳动的脉搏
机器学习揭示老年人群记忆表现的关键生活暴露因素:基于多元队列的SHAP值解析
【字体: 大 中 小 】 时间:2025年08月21日 来源:Alzheimer's & Dementia 11.1
编辑推荐:
这篇研究采用XGBoost机器学习模型结合SHAP(Shapley Additive exPlanation)值分析,系统评估了12种生活暴露因素(LEFs)对2245名多元族裔老年人记忆功能的影响。研究发现年龄、性别、教育程度、志愿服务、收入及感官健康(如听力、视力)是记忆表现的核心预测因子,且在不同性别和族裔亚组中呈现差异性权重,为阿尔茨海默病及相关痴呆(ADRD)的精准干预提供了新思路。
2024年《柳叶刀》委员会报告指出,全球45%的阿尔茨海默病及相关痴呆(ADRD)病例可通过干预14种可调控健康风险因素(如教育、心血管疾病、睡眠障碍等)实现延迟或预防。这些生活暴露因素(Life Exposure Factors, LEFs)受社会文化背景和资源获取差异影响,导致不同族裔和性别群体的ADRD风险存在显著差异。例如,亚裔和白人老年人的ADRD患病率显著低于黑人和西班牙裔群体。传统研究方法如人群归因分数(PAFs)难以捕捉因素间的复杂交互作用,而本研究创新性地采用回归树机器学习模型(XGBoost)与SHAP值解释框架,首次在多元老年人群中量化LEFs对记忆功能的边际贡献。
研究数据来自美国加州北部凯撒医疗系统的两项队列:KHANDLE(健康老龄化与多元生活经历研究)和STAR(非裔美国人健康老龄化研究),共纳入2245名54-90岁成年人(37%男性,44%黑人)。记忆功能通过西班牙/英语神经心理评估量表(SENAS)的言语记忆复合得分(z分数)衡量。分析的12项LEFs包括教育年限、收入等级、志愿服务、运动频率(轻/剧烈)、感官健康(听力/视力)、睡眠(时长/质量)、吸烟史、酒精摄入(CDC标准)及创伤性脑损伤(TBI),均通过标准化问卷采集。
XGBoost模型通过75%/25%训练-测试集分割优化超参数,结合5折交叉验证避免过拟合(测试集R2=0.326,优于传统回归的0.311)。SHAP值则提供全局重要性排名(均值绝对SHAP值)和个体化影响解释,揭示变量间的非线性关系和交互效应。
全局分析显示:
人口统计学因素:年龄(SHAP=0.209)和女性性别(0.201)是记忆功能的最强预测因子,高龄与记忆衰退显著相关,女性普遍优于男性。
社会经济因素:教育(0.112)和收入(0.054)位列第三、四位,其中西班牙裔群体的教育影响尤为突出(重要性为其他族裔1.5倍)。
生活方式因素:志愿服务(0.054)的贡献超过多数健康指标,其机制可能通过增强社交互动和认知储备实现。中等频率剧烈运动(非每日或从不)和6-7小时睡眠时长对记忆最有利,呈现U型曲线关系。
感官健康:听力(0.031)和视力(0.033)的影响存在性别差异——男性更依赖听力,女性更依赖视力。
分层分析发现:
性别差异:女性中收入的重要性比男性高70%,而剧烈运动对女性的保护作用更强(SHAP=0.031 vs 0.022)。
族裔差异:黑人身份对记忆的负面影响(SHAP=-0.04)可能反映结构性歧视的累积效应;西班牙裔群体的教育回报率最高,支持早期教育干预的优先性。
个体化模型(图4瀑布图)示例:
高教育/高收入且参与志愿服务的女性,性别因素贡献+0.15 SHAP值,而同等条件的男性因性别损失-0.12值。
低教育/低收入群体中,教育缺陷的负面影响(-0.25)远超性别差异,凸显社会经济劣势的压倒性作用。
教育的核心地位与“认知储备”理论一致,其通过双重路径影响记忆:早期技能积累和后期神经可塑性维持。值得注意的是,西班牙裔群体教育回报率更高,可能反映该群体对教育资源获取的边际效益递增。志愿服务的突出重要性为ADRD预防提供了新靶点,其机制可能涉及社会参与对神经炎症的调控。
感官健康的性别特异性提示临床干预需差异化:男性应优先听力矫正,女性需关注视力保护。运动与睡眠的非线性关系警示极端行为(过度运动或过长睡眠)可能抵消益处,支持“适度原则”。
局限性包括自报告数据的测量误差、加州样本的泛化性限制,以及未纳入心血管指标等生物标志物。未来研究可结合纵向设计和因果推理,探索社会经济因素与生物老化的交互机制。
本研究通过机器学习首次量化了LEFs在多元老年人群记忆功能中的分层贡献,揭示教育、志愿服务和感官健康是可干预的共性靶点,而性别和族裔差异呼吁精准化公共卫生策略。该方法为ADRD风险预测和个性化干预提供了可扩展的分析框架。
生物通微信公众号
知名企业招聘