编辑推荐:
认知衰弱(CF)关联老年人群不良健康结局,然传统方法难捕多维风险。本研究基于韩国衰弱与老龄化队列数据,运用机器学习结合递归特征消除和自举法,筛选出运动能力、教育水平等 6 个关键预测因子,构建的模型 AUC 达 84.34%,为 CF 早期检测和干预提供新工具。
随着全球老龄化加剧,老年人群的健康管理成为公共卫生领域的重要挑战。认知衰弱(Cognitive Frailty, CF)作为介于正常衰老与痴呆、身体失能之间的中间状态,因其同时涉及身体衰弱(Physical Frailty, PF)和认知损害(Impaired Cognition, IC),且与跌倒、失能、慢性疾病恶化等不良结局密切相关,正引发广泛关注。目前,CF 的流行病学特征在不同地区差异显著(患病率 1%-50%),传统统计方法因变量范围窄、难以捕捉多维度健康领域的复杂交互作用,限制了对 CF 风险因素的精准识别。此外,缺乏基于特定人群的验证模型,也使得现有研究成果难以推广至多样化的老年群体。因此,开发一种能够整合多维风险因素、适用于社区老年人群的 CF 早期预测模型,成为亟待解决的科学问题。
为回应这一需求,韩国延世大学(Yonsei University)和庆熙大学(Kyung Hee University)的研究团队,基于韩国衰弱与老龄化队列研究(Korean Frailty and Aging Cohort Study, KFACS)2016-2017 年的 2404 名社区老年人群数据,开展了一项基于机器学习的 CF 风险评估研究。该研究成果发表在《Scientific Reports》,为 CF 的早期干预提供了新的技术路径和理论依据。
研究人员主要采用了以下技术方法:首先,通过单因素逻辑回归分析筛选与 CF 相关的社会人口学、临床及健康状态特征;随后,运用机器学习中的逻辑回归模型,结合递归特征消除(Recursive Feature Elimination)和自举法(Bootstrapping),对 24 个候选特征进行优化排序,确定最优预测因子组合;最后,通过合成少数过采样技术(Synthetic Minority Over-sampling Technique, SMOTE)处理样本不平衡问题,评估模型的预测性能(以受试者工作特征曲线下面积 AUC、灵敏度、特异度、准确度为指标)。
研究结果
1. 参与者分类与单因素分析
研究将参与者分为 CF 组(18.4%)和非 CF 组(81.6%)。CF 组在衰弱表型(如缓慢、虚弱、疲劳等) prevalence 显著更高,简易精神状态检查(Mini-Mental State Examination, MMSE)得分更低(均 p<0.01)。单因素分析显示,高龄、女性、低教育水平、外周血管疾病、骨关节炎、抑郁症、日常活动能力(Korean Activities of Daily Living, K-ADL)下降、运动能力(如起立 - 行走测试时间 Timed Up and Go Test, TUG≥10 秒)降低、营养状态(微型营养评估 Mini Nutritional Assessment, MNA)差等因素均与 CF 风险显著相关(p<0.05 或 p<0.01)。
2. 机器学习模型与特征选择
通过递归特征消除,模型筛选出 6 个最优特征:TUG 测试时间、教育水平、身体功能限制(Physical Frailty and Mobility, PF-M)、MNA 评分、平衡信心(Activities-specific Balance Confidence, ABC)、K-ADL 评分。当特征数量为 6 时,模型性能稳定,AUC 达 84.34%,灵敏度 75.12%,特异度 80.87%,准确度 79.51%。进一步分析显示,TUG 测试时间每增加 1 秒,CF 风险降低 51.5%(OR=0.485);MNA 评分每增加 1 分,风险降低 20.5%(OR=0.795),表明运动能力和营养状态对 CF 发生具有强预测价值。
研究结论与讨论
本研究通过整合多维健康数据和机器学习技术,成功构建了 CF 风险预测模型,识别出运动能力、教育水平、身体功能限制、营养状态、平衡信心、日常活动能力 6 个关键预测因子。模型不仅在韩国社区老年人群中展现出良好的预测效能(AUC>80%),更通过纳入可测量的临床指标(如 TUG 测试、MNA 评分),为基层医疗提供了便捷的筛查工具。
研究结果强调了 CF 的多维度属性:运动功能下降与认知损害通过基底神经节、小脑等共享神经回路相互作用,形成恶性循环;低教育水平反映的认知储备不足和社会经济差异,加剧了 CF 的易感性;营养状态差和慢性炎症则通过影响神经可塑性和肌肉功能,推动 CF 进展。此外,模型中平衡信心(ABC)的纳入,提示心理因素(如跌倒恐惧)在 CF 发生中的重要作用,为干预策略提供了新靶点。
尽管研究存在回顾性设计、样本局限于韩国人群、未纳入生物标志物等不足,但其提出的 “多维评估 + 机器学习” 模式,为跨地域 CF 研究提供了方法论参考。未来研究若能结合纵向数据、生物标志物(如炎症因子、脑影像指标)及更广泛的社会因素,将进一步提升模型的普适性和机制解析深度。
总之,该研究通过数据驱动的方法,为 CF 的早期识别和个性化干预开辟了新路径。临床实践中,整合 TUG 测试、营养评估等简单指标的风险筛查,有望实现 CF 的 “早发现、早干预”,延缓老年人群认知与身体功能衰退,降低医疗负担,具有重要的公共卫生和临床应用价值。