
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于预训练Transformer模型的远程医疗对话与护理记录分析预测急诊风险研究
【字体: 大 中 小 】 时间:2025年07月03日 来源:European Heart Journal - Digital Health 4.0
编辑推荐:
本研究针对慢性病患者急性恶化风险预测难题,创新性地利用远程医疗对话转录文本和护理记录,构建基于BERT等预训练Transformer模型的预测系统。通过分析94例急诊患者和36例对照的981份记录,证实结合护理记录可使预测准确率达0.892,为远程医疗风险预警提供了智能化解决方案。
慢性病管理面临的最大挑战之一是如何及时识别患者的急性恶化风险。尽管远程医疗(telehealth)项目已被证实能有效降低慢性病患者死亡率,但在日常远程沟通中,护士与患者的对话内容尚未被系统性地用于预测临床事件。这项发表在《European Heart Journal - Digital Health》的研究,由国立台湾大学医院团队开展,开创性地探索了如何通过分析远程医疗对话和护理记录来预测急诊就诊风险。
慢性病如心力衰竭的恶化往往具有隐匿性,在患者前往急诊室(ER)就诊前就可能出现细微变化。例如GALACTIC研究显示,急性失代偿性心力衰竭患者从出现呼吸困难到急诊就诊的中位时间为6天。这种渐进性恶化特征为早期干预提供了宝贵时间窗。目前远程医疗中心主要依靠人工判断患者状态,缺乏自动化预警系统。该研究正是针对这一临床痛点,尝试建立基于人工智能的风险预测模型。
国立台湾大学医院Hui-Wen Wu和Chi-Sheng Hung领衔的研究团队,创新性地将自然语言处理(NLP)技术应用于远程医疗领域。他们假设通过分析患者与护士的日常对话内容及结构化护理记录,可以提前识别急诊就诊风险。这项研究不仅填补了该领域空白,也为开发虚拟护理助手奠定了基础。
研究团队采用多项关键技术方法:收集2013-2014年间1857份录音及对应护理记录,专业转录员人工转写对话内容;使用6种中文预训练Transformer模型(包括BERT-base-Chinese、Chinese-xlnet-base等)处理文本;采用滑动窗口技术克服BERT模型的512标记长度限制;部分实验加入长短期记忆网络(LSTM)捕捉时序特征;最终构建预测2周内急诊就诊风险的分类模型。
研究结果部分呈现了多项重要发现:
基线实验显示,仅使用对话转录文本时,BERT-base-Chinese模型表现最佳,准确率达0.773,敏感性高达0.949,表明其识别高风险患者的能力突出。
实验1引入滑动窗口技术后,整体准确率提升至0.75(IQR 0.742-0.773),其中Chinese-xlnet-base模型展现出0.78的优异准确率,证实滑动窗口能有效捕捉长文本中的关键信息。
实验2加入LSTM网络分析时序特征,结果显示不同时间窗口(1天、1-3天、1-7天、1-14天)的预测性能无显著差异,提示简单时序建模可能无法进一步提升短期风险预测。
实验3将护理记录与对话文本结合,取得突破性进展 - 整体准确率跃升至0.892(IQR 0.891-0.893),特异性普遍超过0.96,但敏感性降至约0.3,表明结构化护理记录能显著提高规则排除能力。
实验4在结合护理记录基础上加入LSTM,发现相比实验3未带来显著提升,且需要更多计算资源,证实简单模型架构已足够满足需求。
研究结论部分指出,这是首个证实远程医疗对话可用于预测急诊风险的研究。虽然单独使用对话内容已能达到中等预测准确率,但结合结构化护理记录可使性能大幅提升。这种基于NLP的方法为远程医疗风险预警提供了新思路,未来可应用于家庭医院等场景,帮助识别需要转入传统医院的患者。研究也揭示了敏感性与特异性间的权衡关系,为临床部署提供了重要参考。
该研究的创新价值体现在多个维度:首次将原始医患对话作为预测模型输入;验证了预训练Transformer模型在中文医疗对话分析中的适用性;证实结构化与半结构化数据融合的优势;为开发虚拟护理助手奠定技术基础。这些发现将推动远程医疗从被动响应向主动预警转变,有望改善慢性病患者管理效果。
生物通微信公众号
知名企业招聘