大语言模型用于患者护理的现状、挑战与突破:系统性综述洞察医疗新变革

【字体: 时间:2025年01月23日 来源:Communications Medicine 5.4

编辑推荐:

  大语言模型(LLMs)在医疗领域潜力巨大,但在患者护理方面缺乏系统信息。研究人员为此开展系统性综述,分析 89 项研究后发现,LLMs 应用广泛但存在设计和输出方面的局限。该研究为其在医疗中的应用提供框架,助力医疗发展。

  在科技飞速发展的当下,大语言模型(Large Language Models,LLMs)如同闯入医疗领域的 “神奇钥匙”,引发了各界的广泛关注。自 2022 年 11 月 OpenAI 的 ChatGPT 问世以来,LLMs 凭借其强大的文本生成能力,在多个领域展现出巨大潜力。在医疗行业,人们期望它能成为改善患者教育、拓展医疗知识获取途径的得力助手,让患者更好地理解健康状况和治疗方案,推动个性化医疗的发展。
然而,理想很丰满,现实却很骨感。尽管 LLMs 在医疗领域的研究日益增多,但在患者护理方面,相关信息却十分零散,缺乏系统性的梳理。比如,不同的 LLMs 在回答医学问题、生成患者信息时表现各异,其准确性、可靠性以及潜在风险都亟待评估。在这种情况下,开展一项全面、系统的研究显得尤为重要,它能帮助我们清晰地认识 LLMs 在患者护理中的真实状况,为其在医疗领域的合理应用指明方向。

来自德国慕尼黑工业大学(Technical University of Munich)等多个研究机构的研究人员勇挑重担,针对这一问题展开了深入探究。他们的研究成果发表在《Communications Medicine》杂志上,为我们带来了关于 LLMs 在患者护理中应用的全面且深入的见解。

研究人员采用了系统的研究方法。首先,他们在国际前瞻性系统评价注册库(PROSPERO)进行了预注册,并严格遵循系统评价和荟萃分析的首选报告项目(PRISMA)指南。他们在 Web of Science、PubMed 等 5 个数据库中,搜索了 2022 年 1 月 1 日至 2023 年 12 月 31 日期间发表的关于 LLMs 在患者护理中应用的定性、定量和混合方法研究。经过层层筛选,从最初的 4349 条记录中,最终确定了 89 项符合要求的研究纳入分析。随后,他们运用混合方法评估工具 2018(Mixed Methods Appraisal Tool 2018)对这些研究进行质量评估,并采用数据驱动的收敛合成方法,通过在 Dedoose 软件中逐行编码,对 LLMs 的应用和局限性进行主题合成分析。

在研究结果部分,研究人员发现,大多数研究聚焦于基于生成式预训练变换器(Generative Pre-trained Transformers,GPT)3.5(占所研究的 124 种不同 LLMs 的 53.2%)和 GPT-4(占 26.6%)架构的 LLMs 在回答医学问题方面的应用,其次是患者信息生成,包括医学文本总结、翻译以及临床文档撰写等。

进一步深入分析 LLMs 的局限性时,研究人员归纳出两个主要方面:设计和输出。在设计方面,许多研究指出 LLMs 存在诸多不足。例如,近半数研究(46/89,51.7%)认为 LLMs 未针对医学领域进行优化,缺乏临床背景知识(13/89,14.6%),临床推理能力有限(7/89,7.9%) ,在处理和生成医学图像方面也存在局限(5/89,5.6%)。同时,数据相关问题也较为突出,如训练数据来源不透明(36/89,40.5%),网络数据访问受限(22/89,24.7%),参考文献的提供、评估和验证存在局限(20/89,22.5%) 。此外,还有算法不透明、交互对话能力有限、无法自我验证和纠正等问题。

输出方面同样问题重重。非重复性(38/89,42.7%)是一个显著问题,模型输出具有不确定性,多次迭代结果不一致,且难以提供可靠的参考文献。非全面性(78/89,87.6%)也普遍存在,输出内容可能不完整、缺乏个性化,提供的信息可能不符合医疗标准,甚至过时。正确性方面(78/89,87.6%),LLMs 会生成错误信息,如幻觉(38/89,42.7%),即产生毫无根据的虚构信息;还有错觉、谵妄、妄想、虚构等多种错误类型。安全性也是一大隐患(39/89,43.8%),生成的内容可能存在误导性(34/89,38.2%),甚至有害(26/89,29.2%)。而且,LLMs 的输出还高度依赖输入内容和环境,输入的质量、复杂性、特异性等都会影响输出结果,模型在不同环境下可能会给出不恰当的建议。

在研究结论与讨论部分,这项研究意义重大。它首次系统地梳理了 LLMs 在患者护理中的应用和局限性,构建了一个全面的框架和分类体系,为医疗专业人员和开发者评估 LLMs 在患者护理中的潜在风险提供了重要依据。通过明确 LLMs 的问题所在,为其后续的改进和优化指明了方向,有助于临床医生更全面地了解 LLMs 的优缺点,从而在实际应用中做出更明智的决策。

尽管 LLMs 在医疗领域展现出一定潜力,但目前的研究结果也警示我们,其距离可靠的自主医疗应用还有很长的路要走。未来,需要在提高模型的可靠性、透明度、安全性等方面加大研究力度,同时加强监管和人为监督,确保患者的安全和利益。随着技术的不断发展,LLMs 有望在医疗领域发挥更大的作用,为改善医疗服务、推动医学进步贡献力量。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号