基于自然语言处理的CAM-BERT模型开发：提升巴西住院老年患者谵妄筛查效率

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年07月18日 来源：Computers in Biology and Medicine 7.0

编辑推荐：

　　本研究针对巴西住院老年患者谵妄筛查率低下的临床难题，开发了基于巴西葡萄牙语临床文本的深度学习模型CAM-BERT。通过整合BERTimbau框架与随机森林算法，模型在症状识别中取得F1-macro 77%的优异表现，映射至CAM标准后进一步提升至83%，为葡萄牙语医疗环境下的谵妄早期识别提供了高效AI解决方案。

在老龄化社会背景下，谵妄(delirium)这个被称为"老年医学急诊"的综合征正引发越来越多的关注。这种以急性注意力障碍和认知功能波动为特征的病症，犹如一场突如其来的大脑"风暴"，影响着全球23%的住院老年患者。然而令人担忧的是，由于症状复杂多变、与痴呆重叠度高，加上医护人员识别能力不足，竟有三分之二的谵妄病例在临床中被漏诊。更棘手的是，在巴西等葡萄牙语国家，医疗记录中混乱的症状描述使得这一问题雪上加霜。

面对这一挑战，Hospital Israelita Albert Einstein的研究团队开展了一项开创性研究。他们敏锐地发现，虽然英语国家已利用自然语言处理(NLP)技术实现了90%以上的谵妄识别准确率，但葡萄牙语这类"低资源语言"却面临着独特的技术壁垒——复杂的动词变位、名词性别变化以及重音符号系统，使得通用NLP模型难以准确解析医疗文本。为此，研究人员开发了专门针对巴西葡萄牙语的CAM-BERT模型，相关成果发表在《Computers in Biology and Medicine》上。

研究团队采用了三项关键技术：首先从500例65-99岁住院患者的电子健康记录(EHR)中提取临床文本，由专家根据标准化协议标注谵妄症状；其次采用基于巴西葡萄牙语预训练的BERTimbau深度学习模型，与随机森林算法进行对比；最后创新性地开发了CAM-BERT框架，将模型识别的症状自动映射至国际通用的谵妄评估标准(CAM)。

【研究设计】通过回顾性分析2018-2022年间住院患者的临床记录，建立了包含平均年龄80.2岁、51%为女性患者的队列，其中34.6%曾入住ICU，为模型训练提供了真实世界数据。

【模型性能】BERTimbau展现出显著优势，其F1-macro达77%，远超基线模型39%的表现。在识别"意识混乱"和"思维紊乱"等核心症状时，F1值接近90%。通过CAM-BERT框架进行症状-CAM标准映射后，整体性能提升至83%，与专家评估的一致性达到Cohen's kappa 0.72。

【语言特性】研究特别分析了葡萄牙语的语法挑战，如动词需根据时态、语态和人称进行复杂变位，形容词需与名词保持性别一致，这些特性增加了NLP模型开发的难度，也凸显了本研究的创新价值。

这项研究的意义不仅在于创造了首个针对巴西葡萄牙语的谵妄识别AI工具，更开辟了非英语医疗文本分析的创新路径。CAM-BERT框架的提出，实现了从症状识别到临床诊断标准的智能转化，为资源有限地区的谵妄筛查提供了可行方案。值得注意的是，该模型在识别思维紊乱等核心症状方面的优异表现，可能改变依赖主观评估的传统筛查模式。

正如研究者指出，这项技术的临床应用仍需在更多医疗环境中验证，但其已展现出填补葡萄牙语国家谵妄筛查空白的潜力。未来，这种基于深度学习的NLP方法或将成为多语言医疗环境下的标准化筛查工具，为全球老年医疗质量提升贡献重要力量。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号