针对居住在养老院的老年人的认知脆弱性,开发并比较验证了多种模型

《Frontiers in Public Health》:Development and comparative validation of multiple models for cognitive frailty in older adults residing in nursing homes

【字体: 时间:2025年09月16日 来源:Frontiers in Public Health 3.4

编辑推荐:

  认知衰弱预测模型研究:基于机器学习的养老院老人认知衰弱风险建模及验证。采用支持向量机(SVM)、随机森林(RF)等5种算法,构建包含19个变量的预测模型。结果显示SVM在测试集AUC达0.932,外部验证集AUC 0.751,优于其他模型。关键预测因子包括ADL、认知活动频率、年龄、抑郁、运动频率等。研究证实机器学习模型可有效评估养老院老人认知衰弱风险,为早期干预提供工具。

  本研究聚焦于如何利用机器学习技术,构建一个针对居住在养老院中的老年人的认知脆弱性(CF)预测模型。认知脆弱性是一种临床综合征,表现为轻度认知障碍与身体脆弱性的共存,但不包括阿尔茨海默病和各种类型的痴呆症。这一状态被认为是痴呆症的早期阶段,主要由身体状况引发,而非神经退行性疾病。随着人口老龄化的加速,养老院成为老年人主要的照护场所,而这一群体往往面临复杂的身体和心理健康问题,因此,及时识别CF并采取干预措施显得尤为重要。

在方法上,研究团队从杭州市的四家养老院中招募了500名老年人作为建模队列,又从另一家养老院招募了112名老年人作为外部验证队列。研究者选取了19个变量,涵盖了社会人口学特征、健康状况指标、身体功能测量以及生活方式因素。这些变量包括年龄、性别、婚姻状况、教育水平、退休后职业、自我健康评估、慢性疼痛、跌倒史、抑郁状态、营养状况、日常活动能力(ADL)、握力、步速、体重指数(BMI)、睡眠时间、运动频率、智力活动频率、吸烟史和饮酒史等。为了确保模型的准确性和稳定性,研究者采用分层抽样方法将建模队列随机划分为训练集(70%)和测试集(30%),并使用LASSO算法进行特征选择,最终确定了10个对CF预测具有显著影响的变量。

在模型构建过程中,研究者应用了五种机器学习算法:K近邻(KNN)、支持向量机(SVM)、逻辑回归(LR)、随机森林(RF)和极端梯度提升(XGBoost)。这些算法各有特点:KNN擅长处理非线性关系,但容易出现过拟合问题;SVM通过核函数解决复杂的非线性分类问题,具有较高的预测精度;LR是一种可解释的线性模型,适合验证线性关系;RF和XGBoost作为集成树模型,能够有效处理高维数据和特征相关性,同时XGBoost在计算效率上更具优势。考虑到数据集的规模较小以及包含大量分类变量,研究者认为树模型比深度学习模型更适合当前任务。

模型的评估采用多种指标,包括ROC曲线、校准曲线、决策曲线分析以及准确率、精确率、召回率、Brier分数和F1分数。其中,SVM模型在测试集上表现最佳,其AUC值达到0.932,显示出较强的预测能力。而在外部验证队列中,SVM的AUC值为0.751,表明其在不同群体中的泛化能力也较为可靠。相比之下,XGBoost虽然在内部数据集上具有较高的AUC值(0.964),但在外部验证中表现明显下降,尤其是准确率和精确率,这可能与其对特定群体特征的敏感性有关。KNN和LR模型则在测试集和外部验证中表现出较一致的性能,但其校准能力和临床适用性略逊于SVM。RF模型在测试集上表现稳定,但在外部验证中有所波动,这表明其在不同人群中的适应性可能不如SVM。

为了增强模型的可解释性,研究者还进行了SHAP值分析,该分析揭示了关键变量对CF预测的稳定影响方向。例如,ADL、智力活动频率、年龄、运动频率、抑郁状态和营养状况均对CF的预测具有显著作用。SHAP值分析表明,这些变量在两个数据集中的影响方向一致,但其相对重要性可能略有不同。研究者认为,这种一致性表明模型在不同群体中具有一定的通用性,但并不意味着这些变量的分布完全相同。

研究结果显示,ADL、智力活动频率、年龄、抑郁状态、营养状况等是CF的主要预测因素。这些变量与CF之间的关系在多个方面得到了验证:例如,ADL的下降与身体功能的减退密切相关,这可能导致脑源性神经营养因子的分泌减少和脑血流下降,从而加速认知能力的衰退。此外,营养状况和运动频率的改善可以有效提升肌肉力量和身体功能,进而降低CF的风险。而抑郁状态则与CF的进展密切相关,可能通过慢性炎症、神经可塑性受损和社会参与减少等机制影响认知功能。跌倒史也被认为是CF的潜在风险因素,可能与脑损伤、身体活动减少和心理压力有关。

社会人口学因素同样对CF的预测具有重要意义。例如,婚姻状况与CF之间存在显著关联,已婚或有配偶的老年人表现出较低的CF风险,而独居者则面临更高的风险。这可能与社会支持、情感交流和心理安全感等因素有关。教育水平也显示出对CF的保护作用,较高的教育水平可能与更强的认知储备和更丰富的健康资源获取能力相关。此外,年龄是影响CF的关键变量,随着年龄的增长,神经退行性变化和神经元损伤的累积可能加剧认知功能的下降。

尽管SVM模型在预测性能上表现最佳,但研究者也指出了一些局限性。首先,研究采用的是横断面设计,无法推断CF与相关因素之间的因果关系。其次,由于不同群体在关键预测因素上的分布差异较大,模型在外部验证中的表现有所下降。此外,研究未纳入某些潜在的生物标志物,如血液中的特定生化指标,这可能影响模型的全面性。最后,标签编码可能在处理纯名义变量时引入人为的顺序关系,未来研究可以考虑使用独热编码以提高模型的准确性。

本研究的结论指出,SVM模型在养老院老年人CF预测中具有最佳的泛化能力和临床适用性。该模型能够稳定地识别CF风险,并且其预测结果具有可解释性,便于护理人员理解和应用。通过早期识别高风险个体,养老院可以更有针对性地实施干预措施,从而延缓认知功能的下降,提升老年人的生活质量。此外,研究还提出了具体的干预策略,如通过音乐疗法、团体回忆治疗和智力游戏来促进认知活动,同时建议使用标准化的评估工具和证据支持的干预方案,以确保干预措施的有效性和可行性。

本研究的意义在于,它不仅为养老院中的CF预测提供了科学依据,还强调了模型可解释性在实际应用中的重要性。随着人工智能和机器学习技术的不断发展,这些方法在医疗领域的应用日益广泛。然而,模型的实际效果往往受到数据来源、群体特征和外部环境的影响。因此,未来的研究应更加关注模型的适应性和泛化能力,通过引入领域适应技术、模型再校准和多中心验证框架,提高预测工具在不同人群和不同环境中的适用性。此外,研究者还建议在模型构建过程中纳入更多潜在的预测变量,以提高模型的全面性和准确性。

综上所述,本研究通过构建和验证多种机器学习模型,为养老院中的CF预测提供了重要的科学依据。SVM模型因其稳定性和可解释性,被认为是当前最适合用于临床实践的预测工具。研究结果不仅有助于护理人员更准确地评估老年人的CF风险,还为制定有效的预防和干预措施提供了理论支持和实践指导。未来,随着更多数据的积累和技术的进一步发展,CF预测模型有望在更广泛的护理环境中得到应用,为老年人的健康管理和生活质量提升做出更大贡献。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号