人工智能赋能患者出院指导翻译:人机协同策略的多学科评估与临床转化价值
《npj Digital Medicine》:Evaluating human-in-the-loop strategies for artificial intelligence-enabled translation of patient discharge instructions: a multidisciplinary analysis
【字体:
大
中
小
】
时间:2025年10月26日
来源:npj Digital Medicine 15.1
编辑推荐:
本研究针对非英语患者医疗文书翻译质量不均、传统翻译服务效率低下等问题,系统评估了ChatGPT-4o、纯人工翻译及人机协同(AI生成+专业译后编辑)三种模式在六种语言(含数字化低资源语言)中的表现。结果表明,人机协同翻译在质量上媲美甚至优于专业翻译,效率提升约60%,且成为多学科评估者最偏好模式。该策略为临床语言公平提供了安全、高效的实施路径,对推动AI在医疗场景的负责任落地具有重要参考价值。
在美国,超过2500万人的英语熟练程度有限,医疗沟通障碍导致这类人群的用药依从性、医疗资源利用及不良事件风险显著恶化。尽管联邦政策要求提供语言服务,但医院翻译服务成本高、耗时长,难以满足出院指导等时效性沟通需求。近年来,人工智能(AI)驱动的机器翻译为解决这一难题带来新希望,但其在数字化低资源语言(如索马里语、亚美尼亚语)中的准确性和安全性仍存疑。此外,现行法规要求机器翻译需经专业审核,而“人在回路”(Human-in-the-Loop)这一人机协同模式在医学翻译中的效果尚未系统评估。
为此,研究团队在《npj Digital Medicine》发表论文,首次通过多学科视角(语言学家、临床医生、家庭照护者)对比ChatGPT-4o、纯人工翻译及人机协同三种模式在六种语言(阿拉伯语、亚美尼亚语、孟加拉语、简体中文、索马里语、西班牙语)中的表现。研究选取20份真实儿科出院指导文本,从信息完整性、语言流畅性、语义准确性、临床风险及整体质量五个维度进行评分(1-5分利克特量表)。
研究提取波士顿儿童医院非外科住院患者的实际出院指导文本,通过第三方翻译服务(LanguageLine)完成专业翻译与人机协同翻译,ChatGPT-4o使用标准化提示词生成翻译。42名评估者(12名语言学家、16名临床医生、14名家庭照护者)在盲态下评分,并记录翻译耗时。统计采用弗里德曼检验与威尔科克森符号秩检验分析评分差异,t检验比较时间效率。
ChatGPT-4o表现因语言而异:在西班牙语和孟加拉语中与专业翻译质量相当,但在数字化低资源语言(如亚美尼亚语和索马里语)中评分显著较低(亚美尼亚语整体质量分差达1.2分)。人机协同翻译在多数语言中达到或超越专业翻译水平,例如亚美尼亚语整体质量分提升0.3分(p=0.01),西班牙语信息完整性分提高0.4分(p=0.01)。
人机协同模式成为最受青睐的选择(总偏好率46.5%),尤其在孟加拉语中偏好率达53.6%。ChatGPT-4o除西班牙语外均最不受欢迎(亚美尼亚语仅5%偏好率)。人机协同翻译耗时显著短于专业翻译(平均7.1分钟 vs. 16.8分钟,p<0.001),索马里语翻译效率提升最高(耗时减少81%)。
本研究证实,完全依赖AI的翻译在低资源语言中存在临床风险,而人机协同策略能兼顾质量与效率,成为安全实施AI翻译的关键路径。其优势源于语言学家对文化语境和临床细节的修正能力,尤其在语法结构复杂的语言中作用显著。作者建议:低风险场景(如预约提醒)可尝试全自动翻译,但出院指导等关键沟通需坚持人工审核。未来需建立多语言基准数据集,并将患者、照护者纳入AI治理框架,以推动健康公平。
该研究为医疗AI的负责任落地提供了实证支持,凸显了跨学科合作在技术优化中的核心价值。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号