
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于自然语言处理的CAM-BERT模型开发:提升巴西住院老年患者谵妄筛查效率
【字体: 大 中 小 】 时间:2025年07月18日 来源:Computers in Biology and Medicine 7.0
编辑推荐:
本研究针对巴西住院老年患者谵妄筛查率低下的临床难题,开发了基于巴西葡萄牙语临床文本的深度学习模型CAM-BERT。通过整合BERTimbau框架与随机森林算法,模型在症状识别中取得F1-macro 77%的优异表现,映射至CAM标准后进一步提升至83%,为葡萄牙语医疗环境下的谵妄早期识别提供了高效AI解决方案。
在老龄化社会背景下,谵妄(delirium)这个被称为"老年医学急诊"的综合征正引发越来越多的关注。这种以急性注意力障碍和认知功能波动为特征的病症,犹如一场突如其来的大脑"风暴",影响着全球23%的住院老年患者。然而令人担忧的是,由于症状复杂多变、与痴呆重叠度高,加上医护人员识别能力不足,竟有三分之二的谵妄病例在临床中被漏诊。更棘手的是,在巴西等葡萄牙语国家,医疗记录中混乱的症状描述使得这一问题雪上加霜。
面对这一挑战,Hospital Israelita Albert Einstein的研究团队开展了一项开创性研究。他们敏锐地发现,虽然英语国家已利用自然语言处理(NLP)技术实现了90%以上的谵妄识别准确率,但葡萄牙语这类"低资源语言"却面临着独特的技术壁垒——复杂的动词变位、名词性别变化以及重音符号系统,使得通用NLP模型难以准确解析医疗文本。为此,研究人员开发了专门针对巴西葡萄牙语的CAM-BERT模型,相关成果发表在《Computers in Biology and Medicine》上。
研究团队采用了三项关键技术:首先从500例65-99岁住院患者的电子健康记录(EHR)中提取临床文本,由专家根据标准化协议标注谵妄症状;其次采用基于巴西葡萄牙语预训练的BERTimbau深度学习模型,与随机森林算法进行对比;最后创新性地开发了CAM-BERT框架,将模型识别的症状自动映射至国际通用的谵妄评估标准(CAM)。
【研究设计】通过回顾性分析2018-2022年间住院患者的临床记录,建立了包含平均年龄80.2岁、51%为女性患者的队列,其中34.6%曾入住ICU,为模型训练提供了真实世界数据。
【模型性能】BERTimbau展现出显著优势,其F1-macro达77%,远超基线模型39%的表现。在识别"意识混乱"和"思维紊乱"等核心症状时,F1值接近90%。通过CAM-BERT框架进行症状-CAM标准映射后,整体性能提升至83%,与专家评估的一致性达到Cohen's kappa 0.72。
【语言特性】研究特别分析了葡萄牙语的语法挑战,如动词需根据时态、语态和人称进行复杂变位,形容词需与名词保持性别一致,这些特性增加了NLP模型开发的难度,也凸显了本研究的创新价值。
这项研究的意义不仅在于创造了首个针对巴西葡萄牙语的谵妄识别AI工具,更开辟了非英语医疗文本分析的创新路径。CAM-BERT框架的提出,实现了从症状识别到临床诊断标准的智能转化,为资源有限地区的谵妄筛查提供了可行方案。值得注意的是,该模型在识别思维紊乱等核心症状方面的优异表现,可能改变依赖主观评估的传统筛查模式。
正如研究者指出,这项技术的临床应用仍需在更多医疗环境中验证,但其已展现出填补葡萄牙语国家谵妄筛查空白的潜力。未来,这种基于深度学习的NLP方法或将成为多语言医疗环境下的标准化筛查工具,为全球老年医疗质量提升贡献重要力量。
生物通微信公众号
知名企业招聘