生成式AI在医患沟通管理中的应用与效率评估:基于EHR审计日志的真实世界研究

《npj Digital Medicine》:Utilization of Generative AI-drafted Responses for Managing Patient-Provider Communication

【字体: 时间:2025年10月03日 来源:npj Digital Medicine 15.1

编辑推荐:

  本刊推荐:为解决电子健康记录(EHR)收件箱中患者消息激增导致的医护人员(HCP)工作负担加重问题,研究人员开展了一项关于生成式AI(GenAI)起草回复在医患沟通管理中应用的真实世界研究。通过分析75名HCP使用AI生成回复的EHR审计日志,发现虽然总体使用率较低(19.4%),但提示词优化可提升使用率,且AI起草能缩短6.76%的回复时间。该研究为优化GenAI在临床工作流中的部署策略提供了重要证据。

  
在数字化医疗时代,电子健康记录(EHR)系统已成为医疗机构不可或缺的工具,但随之而来的患者消息激增却给医护人员(HCP)带来了新的挑战。每天涌入EHR收件箱的大量患者咨询,让本已工作繁重的医护人员面临更大的行政负担,这种现象被形象地称为"收件箱疲劳"。研究表明,这种持续的消息处理压力不仅加剧了医护人员的工作负担,更与职业倦怠的发生密切相关4-6
传统的解决方案包括过滤低临床价值消息、将消息委托给高级实践提供者(APP)和支持人员8,以及实施自动化消息分诊9等。然而,这些干预措施效果有限,迫切需要更高效、可扩展的解决方案。在此背景下,生成式人工智能(GenAI)技术应运而生,特别是基于大型语言模型(LLM)的系统,被寄予厚望能够帮助医护人员起草患者消息回复11-15
尽管GenAI在医疗知识应用方面展现出潜力19,20,但其在实际临床环境中的效果仍不明确。先前的研究多基于模拟实验和问卷调查,缺乏真实世界环境下的使用数据15,24。更重要的是,现有评估往往关注时间指标,而忽略了管理患者消息的复杂性——包括阅读询问、查阅病历和解读检查结果等任务42,43,这些正是导致任务切换和认知负荷增加的关键因素44,45
为了填补这一研究空白,纽约大学朗格尼健康中心的研究团队开展了一项创新性研究,利用EHR审计日志这一宝贵的数据源,深入分析了75名医护人员在11个月内使用GenAI起草回复的真实情况。这项发表在《npj Digital Medicine》的研究,为我们理解GenAI在临床工作流中的实际应用提供了重要见解。
研究方法主要包括对EHR审计日志的系统分析,重点关注三个临床站点(两个内科和一个神经科)的75名医护人员的使用数据。研究团队开发了一套完整的评估框架,包括使用率计算、文本特征分析和效率指标评估。通过逻辑回归模型分析影响使用率的因素,并采用时间动作研究方法比较使用AI起草和未使用情况下的工作流程差异。文本分析采用了一系列语言学指标,包括信息量(熵)、情感主观性、阅读难易度和情感内容等,使用LIWC-22( Linguistic Inquiry and Word Count)等工具进行量化分析。
研究结果
样本特征描述
研究共纳入75名参与试点项目的医护人员,其中医师54名(72%),临床支持人员14名(18.67%),行政支持人员7名(9.33%)。在2023年10月11日至2024年8月31日期间,共收到55,767条独特的患者消息,其中约80%(44,454条)的消息未得到回复即被处理。对于这些未回复的消息,GenAI生成的起草平均长度为56个单词,基于成人默读速度238词/分钟计算,估计医护人员阅读这些起草的平均时间为每消息13.51秒。
GenAI起草使用率分析
在5,935条符合条件的消息中,医护人员使用"从起草开始"选项的比例为19.4%。使用率随时间呈现上升趋势,从初始提示词阶段的12%提升至超级提示词更新后的20%。不同角色医护人员的使用模式存在显著差异,行政支持人员的使用率最高(峰值达32%),而医师群体的使用率在三个时期呈现显著差异(test-stat=23.74, p<0.001)。
影响使用率的起草特征
逻辑回归模型识别出多个显著影响使用率的起草特征。信息量(熵)、情感主观性、阅读易读性、情感内容和简洁性都是使用率的显著预测因子。具体而言,熵(β=0.4047, p<0.001)、情感主观性(β=0.4050, p=0.010)和Flesch阅读得分(β=0.0161, p<0.001)与使用率呈正相关。而字数则与使用率负相关(β=-0.0108, p<0.001),表明用户偏好信息丰富但简洁的起草。
使用GenAI起草对工作效率的影响
尽管使用AI起草的消息需要稍多的操作步骤(平均4.71 vs 4.62),但其周转时间中位数缩短了6.76%(331秒 vs 355秒)。然而,消息打开时间中位数增加了7.27%(59秒 vs 55秒),未处理时间中位数增加了15%(23秒 vs 20秒)。在操作类型方面,使用AI起草的消息责任转移操作较少,但创建电话呼叫和医疗审查操作较多。
讨论与意义
本研究通过EHR审计日志的全面分析,揭示了GenAI在医患沟通中的实际应用情况。虽然总体使用率较低,但提示词优化显著改善了使用效果,特别是对医师群体。研究结果强调了定制化部署策略的重要性,需要根据不同医护人员的角色特点优化AI生成内容。
一个值得关注的发现是,GenAI为所有患者消息生成起草的策略可能适得其反。估计显示,当医护人员阅读这些不必要的起草时,每条消息的时间成本增加了135.42%,这与数字极简主义原则相悖。研究建议采用更有针对性的AI部署策略,专注于高价值患者消息类型。
尽管存在局限性(如单中心研究、类别不平衡等),这项研究为GenAI在医疗环境中的优化应用提供了重要指导。未来研究需要结合多中心、混合方法评估,进一步优化起草生成策略,确保AI整合能够真正支持临床工作流,而不引入意外负担。
这项研究的真正价值在于其方法论创新——通过真实世界的EHR使用数据,而非模拟实验或主观报告,为我们理解GenAI在医疗环境中的实际影响提供了可靠证据。随着医疗系统继续探索AI技术的应用,这种基于实证的评估方法将变得越来越重要。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号