编辑推荐:
为解决轻度认知障碍(MCI)早期识别难题,研究人员基于 CHARLS 数据,针对功能障碍老年人开展 MCI 风险预测模型研究。结果显示神经网络模型性能最佳,为临床和社区筛查提供科学工具。
随着全球老龄化加剧,轻度认知障碍(Mild Cognitive Impairment, MCI)作为正常衰老与阿尔茨海默病(Alzheimer’s disease, AD)之间的关键过渡阶段,其早期识别与干预成为医学界关注的焦点。在中国,60 岁以上人群 MCI 患病率达 14.7%,且每年约 20% 的 MCI 患者会进展为 AD,远超健康老人的 2%。功能障碍老年人因常伴随慢性疾病、社交减少等问题,MCI 风险更高,但现有预测模型多基于传统机器学习方法,在捕捉变量间非线性关系及针对该特定人群的适用性上存在局限。因此,开发高效精准的 MCI 风险预测模型,对实现这一高危群体的早期筛查与干预具有重要临床与公共卫生意义。
山东大学研究人员基于 2020 年中国健康与养老追踪调查(CHARLS)数据,开展了针对功能障碍老年人的 MCI 风险预测模型研究。该研究通过多种机器学习算法构建模型,旨在筛选出适用于该人群的最佳预测工具,相关成果发表在《BMC Public Health》。
研究主要采用以下关键技术方法:首先,从 CHARLS 数据库中筛选出 4491 名 60 岁以上功能障碍老年人作为研究对象,基于日常生活活动能力量表(ADL)和工具性日常生活活动能力量表(IADL)定义功能障碍。通过 K 近邻插补法处理缺失数据后,将样本按 7:3 比例分为训练集与测试集。其次,运用 LASSO 回归结合单因素和多因素 Logistic 回归进行特征变量筛选,最终确定 5 个关键影响因素。最后,采用逻辑回归、决策树、随机森林、支持向量机、梯度提升决策树、K 近邻和神经网络共 7 种机器学习算法构建预测模型,并通过网格搜索与 10 折交叉验证优化超参数,利用准确率、精确率、召回率、F1 值、受试者工作特征曲线下面积(ROC AUC)等指标评估模型性能。
特征变量筛选结果
通过 LASSO 回归从 37 个初始变量中筛选出 22 个变量,进一步经单因素和多因素 Logistic 回归分析,最终确定居住地、饮酒、生活满意度、抑郁症状和教育水平为 MCI 的独立预测因素。其中,居住于农村、饮酒、低生活满意度、有抑郁症状和低教育水平均与 MCI 风险升高相关。
预测模型性能比较
7 种模型中,神经网络模型表现最优。训练集上,其准确率为 0.73,精确率 0.72,召回率 0.76,F1 值 0.74,ROC AUC 为 0.81;测试集上,准确率 0.71,精确率 0.70,召回率 0.74,F1 值 0.72,ROC AUC 为 0.80,且在训练集与测试集间性能稳定,无明显过拟合或欠拟合现象。其他模型中,随机森林和逻辑回归表现次之,ROC AUC 分别为 0.74 和 0.73,而 K 近邻模型性能最差。
模型解释性分析
通过 SHAP 值对神经网络模型进行解释,结果显示教育水平是影响力最大的预测因素,低教育水平显著增加 MCI 风险,高教育水平则具有保护作用;居住地方面,城市居住者 MCI 风险低于农村;生活满意度低和存在抑郁症状均与 MCI 风险正相关,饮酒亦会升高 MCI 风险。
研究表明,基于神经网络构建的 MCI 风险预测模型,能有效整合社会人口学、行为和健康状态等多维度变量,在功能障碍老年人中展现出良好的预测效能。该模型不仅识别出教育水平、居住地等关键风险因素,为针对性干预提供了靶点,还通过机器学习技术突破了传统模型在处理复杂非线性关系上的局限。其临床意义在于,为社区和医疗机构提供了一种高效、可扩展的 MCI 早期筛查工具,有望通过简便易得的变量评估实现高危个体的及时识别,助力 AD 的一级预防与疾病进展延缓。
尽管研究存在样本为横断面数据、未纳入神经影像标志物等局限性,但首次针对功能障碍老年人这一特殊群体开发专用预测模型,为后续纵向研究及模型优化奠定了基础。未来若结合生物标志物与更长随访数据,有望进一步提升模型准确性,推动其在临床实践中的广泛应用,为老龄化社会的认知健康管理提供重要科技支撑。