基于机器学习解析超级老人认知储备的关键血液生物标志物及其预测模型构建

【字体: 时间:2025年05月29日 来源:Scientific Reports 3.8

编辑推荐:

  本研究针对老龄化社会认知衰退评估难题,创新性地通过机器学习分析55种血液生物标志物,在39名超级老人(SuperAgers)和42名普通老人队列中鉴定出15种关键生物标志物。研究采用递归特征消除(RFE)和BORUTA算法筛选特征,结合生成式大语言模型(GReaT)数据增强技术,构建准确率达76%的认知域预测模型。SHAP分析揭示了葡萄糖(<92 mg/dL)、高密度脂蛋白(HDL>54 mg/dL)等指标的阈值效应,为无创认知评估提供了新范式。

  

随着全球老龄化加剧,认知衰退成为重大公共卫生挑战。传统神经心理学测试耗时费力,神经影像检查成本高昂,而"超级老人"(SuperAgers)——65岁以上却保持40岁水平认知能力的特殊群体,为破解认知储备机制提供了独特视角。现有研究多聚焦阿尔茨海默病等病理状态,对健康老龄的认知保护因素知之甚少。

梨花女子大学的研究团队在《Scientific Reports》发表突破性研究,首次系统探索血液生物标志物与超级老人认知功能的关联。研究团队整合首尔某医院81名受试者(39名超级老人)的55种血液指标和首尔神经心理筛查量表(SNSB-II)数据,采用机器学习构建预测模型。关键技术包括:1)递归特征消除(RFE)和BORUTA算法筛选关键生物标志物;2)基于大语言模型的GReaT数据增强技术解决小样本问题;3)SHAP值解析生物标志物阈值效应;4)梯度提升树(Gradient Boosting)分类器优化预测性能。

【原始数据分析】
独立样本t检验显示超级老人组在HbA1c、葡萄糖等4项指标存在显著差异(p<0.05)。HDL胆固醇(59.13±10.76 vs 55.55±12.74)和氧化LDL(51.00±3.88 vs 52.37±4.88)呈现边缘显著趋势,提示代谢稳态的重要性。

【生物标志物检测】
通过三重特征选择策略鉴定出15个核心生物标志物:葡萄糖、HDL胆固醇、ALT、平均红细胞血红蛋白浓度(MCHC)、晚期糖基化终产物(AGE)等。其中葡萄糖<92 mg/dL和HDL>54 mg/dL的阈值效应最显著。

【数据增强验证】
GReaT生成的合成数据与原始数据分布高度一致(KL散度=0.0015),使模型在独立测试集达到75.76%准确率(AUC=0.739),显著优于传统统计方法。

【SHAP阈值解析】
认知域特异性分析发现:语言功能与HDL>60 mg/dL强相关,视觉记忆与氧化LDL<50 ng/mL关联,而注意力和执行功能分别受氯离子(Cl>105 mmol/L)和胰岛素(>10μIU/mL)调控,揭示不同脑区的代谢需求差异。

【神经炎症机制】
CD36、RAGE等炎症标志物与视觉空间功能显著相关,支持"代谢-神经炎症"假说。值得注意的是,β淀粉样蛋白和tau蛋白在两组间无差异,提示超级老人的认知保护可能独立于经典神经退行病理。

这项研究开创性地建立了血液生物标志物预测认知储备的框架,其临床价值体现在三方面:1)常规体检指标即可实现认知风险评估;2)发现HDL等代谢指标可能需要高于传统心血管标准的"认知优化阈值";3)为针对代谢通路的干预措施提供靶点。局限性在于样本量较小和横断面设计,未来需通过多中心队列验证。研究通过融合临床医学与人工智能,为老龄化社会的认知健康管理提供了创新解决方案。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号