基于自然语言处理的CAM-BERT模型开发:提升巴西住院老年患者谵妄筛查效率

【字体: 时间:2025年07月18日 来源:Computers in Biology and Medicine 7.0

编辑推荐:

  本研究针对巴西住院老年患者谵妄筛查率低下的临床难题,开发了基于巴西葡萄牙语临床文本的深度学习模型CAM-BERT。通过整合BERTimbau框架与随机森林算法,模型在症状识别中取得F1-macro 77%的优异表现,映射至CAM标准后进一步提升至83%,为葡萄牙语医疗环境下的谵妄早期识别提供了高效AI解决方案。

  

在老龄化社会背景下,谵妄(delirium)这个被称为"老年医学急诊"的综合征正引发越来越多的关注。这种以急性注意力障碍和认知功能波动为特征的病症,犹如一场突如其来的大脑"风暴",影响着全球23%的住院老年患者。然而令人担忧的是,由于症状复杂多变、与痴呆重叠度高,加上医护人员识别能力不足,竟有三分之二的谵妄病例在临床中被漏诊。更棘手的是,在巴西等葡萄牙语国家,医疗记录中混乱的症状描述使得这一问题雪上加霜。

面对这一挑战,Hospital Israelita Albert Einstein的研究团队开展了一项开创性研究。他们敏锐地发现,虽然英语国家已利用自然语言处理(NLP)技术实现了90%以上的谵妄识别准确率,但葡萄牙语这类"低资源语言"却面临着独特的技术壁垒——复杂的动词变位、名词性别变化以及重音符号系统,使得通用NLP模型难以准确解析医疗文本。为此,研究人员开发了专门针对巴西葡萄牙语的CAM-BERT模型,相关成果发表在《Computers in Biology and Medicine》上。

研究团队采用了三项关键技术:首先从500例65-99岁住院患者的电子健康记录(EHR)中提取临床文本,由专家根据标准化协议标注谵妄症状;其次采用基于巴西葡萄牙语预训练的BERTimbau深度学习模型,与随机森林算法进行对比;最后创新性地开发了CAM-BERT框架,将模型识别的症状自动映射至国际通用的谵妄评估标准(CAM)。

【研究设计】通过回顾性分析2018-2022年间住院患者的临床记录,建立了包含平均年龄80.2岁、51%为女性患者的队列,其中34.6%曾入住ICU,为模型训练提供了真实世界数据。

【模型性能】BERTimbau展现出显著优势,其F1-macro达77%,远超基线模型39%的表现。在识别"意识混乱"和"思维紊乱"等核心症状时,F1值接近90%。通过CAM-BERT框架进行症状-CAM标准映射后,整体性能提升至83%,与专家评估的一致性达到Cohen's kappa 0.72。

【语言特性】研究特别分析了葡萄牙语的语法挑战,如动词需根据时态、语态和人称进行复杂变位,形容词需与名词保持性别一致,这些特性增加了NLP模型开发的难度,也凸显了本研究的创新价值。

这项研究的意义不仅在于创造了首个针对巴西葡萄牙语的谵妄识别AI工具,更开辟了非英语医疗文本分析的创新路径。CAM-BERT框架的提出,实现了从症状识别到临床诊断标准的智能转化,为资源有限地区的谵妄筛查提供了可行方案。值得注意的是,该模型在识别思维紊乱等核心症状方面的优异表现,可能改变依赖主观评估的传统筛查模式。

正如研究者指出,这项技术的临床应用仍需在更多医疗环境中验证,但其已展现出填补葡萄牙语国家谵妄筛查空白的潜力。未来,这种基于深度学习的NLP方法或将成为多语言医疗环境下的标准化筛查工具,为全球老年医疗质量提升贡献重要力量。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号