基于大型临床语言模型CD-Tron的电子健康记录早期认知衰退检测研究

【字体: 时间:2025年06月06日 来源:Journal of Biomedical Informatics 4.0

编辑推荐:

  本研究针对阿尔茨海默病及相关痴呆症(AD/ADRD)的早期筛查难题,开发了基于大型临床语言模型CD-Tron的智能检测系统。通过分析4,949份专家标注的临床记录,模型在1,996份独立测试中展现出高灵敏度(仅1例假阴性),并采用SHAP值增强预测可解释性,为临床前阶段认知衰退(CD)的早期识别提供了创新解决方案。

  

随着全球老龄化加剧,阿尔茨海默病及相关痴呆症(AD/ADRD)已成为美国十大死因之一,预计到2060年影响人群将达1400万。这种神经退行性疾病呈现渐进式发展特征,从临床前阶段、轻度认知障碍(MCI)直至痴呆。其中,主观认知衰退(SCD)作为最早可识别的症状阶段,虽无法通过常规检测捕捉,却可能是AD/ADRD的前驱信号。然而现有检测手段如MRI、PET扫描和脑脊液(CSF)分析存在侵入性强、成本高等局限,而电子健康记录(EHR)中蕴含的临床笔记虽能捕捉细微症状,却因非结构化特性难以有效利用。

针对这一临床痛点,Mass General Brigham的研究团队Hao Guan等开发了CD-Tron模型,相关成果发表于《Journal of Biomedical Informatics》。该研究创新性地将大型临床语言模型应用于2,166例患者长达4年的临床笔记分析,通过4,949份专家标注数据微调模型,最终在1,996份独立测试中实现精准识别。研究特别引入SHAP值解释机制,使AI决策过程对临床医生透明可溯。

关键技术方法包括:1)从Mass General Brigham企业数据仓库提取2,166例患者诊断前4年的临床笔记;2)基于临床语言模型架构开发CD-Tron,使用4,949份标注数据进行微调;3)采用SHAP值进行预测解释;4)通过精确率、召回率、F1值、ROC-AUC和PR-AUC多指标评估。

【背景】
研究阐明AD/ADRD早期检测对干预治疗的关键窗口价值,指出EHR相较于传统检测方法的成本与规模优势,同时揭示现有NLP模型如ClinicalBERT在医学专业理解深度上的不足。

【方法】
创新采用GatorTron等大型临床语言模型架构,通过专业标注的临床笔记片段训练模型。实验设计包含严格的数据划分与盲法评估,确保结果可靠性。

【结果】
CD-Tron显著超越基线模型,在保持高灵敏度(仅1例假阴性)的同时,AUC等指标全面提升。SHAP分析揭示"记忆丧失"、"认知评估"等关键文本特征对预测的贡献度。

【讨论】
研究证实大型临床语言模型在捕捉非结构化数据中细微认知变化方面的独特优势,其高灵敏度特别适合临床筛查场景。通过错误分析发现,模型主要误判源于文档中矛盾或模糊的表述。

【结论】
CD-Tron首次实现大型临床语言模型在AD/ADRD早期检测中的转化应用,其创新价值体现在:1)突破传统结构化数据限制,直接处理临床自由文本;2)通过SHAP机制满足临床可解释性需求;3)为大规模认知筛查提供可行方案。该技术框架可扩展至其他神经退行性疾病的早期预警系统开发。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号