基于多队列数据与机器学习模型的老年人群轻度认知障碍早期筛查系统开发与验证

【字体: 时间:2025年07月04日 来源:International Journal of Medical Informatics 3.7

编辑推荐:

  针对老年人群轻度认知障碍(MCI)筛查工具耗时且普及率低的问题,浙江大学团队利用CHARLS和义乌队列数据,开发了基于7项基础体检指标(握力、身高、体重等)的随机森林(RF)模型。该模型在内部测试中AUROC达0.93,外部验证达0.83-0.87,并部署为Streamlit网页应用,为基层医疗提供高效筛查方案。

  

随着全球痴呆症患者数量预计从2019年的5740万激增至205年的1.528亿,阿尔茨海默病等神经退行性疾病的防控已成为公共卫生重点。作为痴呆前驱阶段的轻度认知障碍(MCI)成为关键干预窗口,但现行金标准——简易精神状态检查(MMSE)需专业人员操作10-15分钟/次,难以大规模推广。虽然近年涌现出结合APOE基因、PET影像等技术的多模态机器学习模型,但其高昂成本制约了在基层医疗的应用。

针对这一困境,浙江大学团队在《International Journal of Medical Informatics》发表研究,创新性地利用基础体检数据构建MCI筛查模型。研究整合中国健康与养老追踪调查(CHARLS)2015年数据作为训练集(含34项人口统计学、生活方式及体检指标),通过多数表决法筛选出教育程度、握力、身高、体重、肌酐(creatinine)、平均红细胞体积(MCV)和血小板计数7个核心变量。采用5种机器学习算法比较后,选定性能最优的随机森林(RF)模型,并在CHARLS2011和义乌2021队列中进行外部验证。

关键技术方法
研究采用TRIPOD+AI报告规范,从CHARLS和义乌社区获取3个独立队列数据,以MMSE作为MCI诊断标准。通过特征重要性分析和多数表决筛选变量,比较逻辑回归、支持向量机等5类算法性能,最终选用AUROC最高的RF模型。采用SHAP值增强可解释性,并开发Streamlit网页应用实现临床转化。

研究结果

  1. 模型性能:训练集灵敏度0.906、特异度0.850,AUROC和AUPRC均达0.93;外部验证AUROC分别为0.83(CHARLS2011)和0.87(义乌2021)。
  2. 关键变量:握力与教育程度贡献度最高,血常规指标(MCV、血小板)与体格参数(BMI相关指标)构成重要补充。
  3. 临床应用:部署的网页工具(https://mciscreening.streamlit.app/)实现个体化风险评估,操作时间<1分钟。

结论与意义
该研究突破性地证明常规体检数据可用于高效MCI筛查,7项指标组合既保留临床相关性(如握力反映躯体功能与脑健康关联),又解决传统MMSE的实操瓶颈。模型在时空异质队列中保持稳健性,AUROC波动仅0.04,显著优于依赖神经影像的现有方案(成本降低90%以上)。局限性在于未涵盖APOEε4等遗传因素,未来可通过迁移学习整合多源数据。这项工作为资源受限地区提供了首个可落地的一线筛查工具,推动痴呆防控关口前移。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号