编辑推荐:
在多语言医学教育中,语言障碍及通用机器翻译(MT)系统适配医疗领域问题显著。研究人员基于欧盟 Interact-Europe 项目,开展肿瘤学领域语音翻译(ST)研究,适配 ASR 和 MT 模型。发现 LLMs 翻译质量具竞争力,还发布 ESO 语音数据集,推动医学教育发展。
在医学教育的广阔天地里,不同语言犹如一道道高墙,横亘在各国医疗从业者之间,阻碍着知识的流通与共享。尤其是在肿瘤学领域,专业知识的精准传递至关重要,但语言障碍让欧洲多国的肿瘤学专业人员难以便捷地获取跨语言的培训资源。同时,通用的机器翻译(Machine Translation, MT)系统在翻译医学相关材料时,常常因缺乏专业领域知识而表现不佳,无法满足精准翻译的需求。如何打破这些壁垒,让多语言的医学教育资源得以顺畅流通,成为亟待解决的问题。
为了攻克这一难题,欧盟 Interact-Europe 项目的研究人员开展了一项颇具意义的研究。该项目作为欧洲 “战胜癌症计划” 的一部分,致力于解决欧洲各国(尤其是东西部之间)在课程和资质方面的差距,特别关注外科、放疗、药学、护理等不同专科之间的相互理解。研究人员的目标是将欧洲肿瘤学院(European School of Oncology, ESO)提供的英语预录培训视频,翻译成法语、西班牙语、德语和斯洛文尼亚语,以促进多语言跨专科医学教育。经过一系列研究,他们得出了重要结论,相关成果发表在《Artificial Intelligence in Medicine》上。
研究人员主要采用了以下关键技术方法:首先,对自动语音识别(Automatic Speech Recognition, ASR)和机器翻译(MT)模型进行肿瘤学领域的适配;其次,评估了三类适配医疗领域的 MT 模型,包括从头训练的双语编码器 - 解码器 MT 模型、预训练的大型多语言编码器 - 解码器 MT 模型以及多语言仅解码器大语言模型(Large Language Models, LLMs);此外,还构建并公开了 ESO 语音数据集,用于 ASR、MT 和 ST 模型的训练与评估。
相关工作
大语言模型(如最新的 GPT4)的出现,给机器翻译领域带来了革命性的变化。在最近的 MT 评估活动中,LLMs 在不同语言对中依据不同质量评估指标均名列前茅。然而,在生物医学领域,情况却并非如此清晰,适配领域的 MT 系统仍占据主导地位。
数据集
在 Interact-Europe 项目框架下,ESO 提供了其在线平台 e-ESO 的快照,其中包含截至 2022 年 11 月 18 日与电子会议相关的元数据,具体有 996 个带视频的电子会议,以及随附的幻灯片和人工转录文本(若有)。人工转录文本是自动转录后由志愿者进行后期编辑,并经肿瘤学专业人员审核得到的。
多语言医学教育中的语音翻译
研究人员描述了在 Interact-Europe 项目框架下部署的级联式 ST 系统,该系统集成了适配肿瘤学领域的 ASR 和 MT 系统,并在 ESO 语音数据集上进行了评估。这些系统通过 REST API 投入生产,使 Interact-Europe 项目合作伙伴能够自动为肿瘤学领域的视频生成字幕。整体级联 ST 系统管道中,ASR 和 MT 系统协同工作。
实验
在本部分,研究人员在第 3 节介绍的评估集上对第 4 节描述的适配技术进行了评估。实验结果显示,适配肿瘤学领域的 ASR 系统与通用 ASR 系统相比,词错误率(Word Error Rate, WER)相对降低了 30% 以上;大型预训练 MT 模型(包括编码器 - 解码器和仅解码器的 LLMs)在肿瘤学领域的翻译质量超过了强大的双语 MT 模型;与大型多语言 MT 模型相比,LLMs 在一系列欧洲语言中实现了极具竞争力的翻译质量。
结论
这项工作阐述了如何将 ASR 和 MT 模型适配医疗领域,以翻译 ESO 提供的肿瘤学教育视频。更重要的是,研究人员对大型预训练编码器 - 解码器和仅解码器模型(如 NLLB 和 LLAMA-2)在翻译质量方面进行了全面评估,并与强基线进行了比较,从而能够评估它们作为医疗领域可适配 MT 系统的能力。在 ASR 方面,所报告的结果清楚地表明了领域适配的有效性。
综上所述,该研究成功地将大语言模型应用于多语言医学教育的语音翻译中,打破了语言障碍,提升了翻译质量,为肿瘤学等医学领域的跨语言教育和交流提供了有力支持。公开的 ESO 语音数据集也为科学界在相关领域的研究提供了宝贵资源,有望进一步推动医学教育和研究的国际化发展,助力减少欧洲东西部在癌症护理方面的不平等。