编辑推荐:
为探究检索增强生成(RAG)驱动的患者信息助手(PIA)可行性等,研究发现其可减时但缓解患者担忧不如医生。
在医疗领域,大语言模型(LLMs)正掀起变革浪潮,它能像 “智能大脑” 一样处理和生成类人语言,在临床决策支持、患者教育等诸多方面大显身手。不过,在像知情同意这种对信息准确性和可靠性要求极高的敏感领域,LLMs 却有些 “力不从心”,其生成的信息可能存在准确性、上下文感知和可靠性等问题。就拿获取 CT 检查的知情同意来说,传统方式需要医生花费大量时间进行咨询,这既增加了医生的工作负担,也影响了医疗效率。
为了解决这些问题,来自德国慕尼黑工业大学医院、柏林自由大学等机构的研究人员开展了一项前瞻性对比研究。他们开发了一种基于检索增强生成(RAG)技术的患者信息助手(PIA)聊天应用程序,旨在评估其用于 CT 检查前信息咨询的可行性、可用性和有效性,并与标准的医生咨询和知情同意流程进行对比。该研究成果发表在《Journal of Imaging Informatics in Medicine》上。
研究人员采用了多种关键技术方法。首先,PIA 聊天应用程序整合了 OpenAI 的 ChatGPT 4o和结构化检索机制,通过将 CT 检查前的信息表和数据库构建成知识库,并利用德语模型 mxbai - embed - large - v1 生成语义嵌入,使系统能够根据患者的问题检索最相关的内容,进而让 ChatGPT 4o生成准确且贴合上下文的回答。其次,在统计分析方面,研究人员使用 Python 3.10.12 及相关库,如 Matplotlib、Numpy、Pandas 等,对数据进行处理和分析,判断数据的分布情况,比较不同组之间的差异。
下面来看具体的研究结果:
- 研究队列:研究邀请了 134 名符合条件的患者,其中 86 人同意参与,最终 PIA 组和对照组各 43 人。两组患者在年龄、性别、教育程度、技术设备使用情况和健康状况等基线特征上无显著差异。
- 信息清晰度、理解度和对患者担忧的影响:PIA 组和医生咨询组在信息清晰度、信息涵盖全面性、患者整体知情感受以及对信息传递方式的满意度方面评分相近。然而,在缓解患者对即将到来的检查的担忧方面,医生咨询组更具优势,其平均得分 8.30 ± 2.63,而 PIA 组为 6.46 ± 3.29(p = 0.003)。
- CT 检查前咨询时长:PIA 组在接受标准的 CT 检查前医生咨询和知情同意之前,咨询时间显著缩短,中位数为 120 秒(四分位间距:100 - 140),而仅接受医生咨询的对照组为 195 秒(四分位间距:170 - 220)(p = 0.04) 。
- 对 PIA 或医生咨询的偏好:在 PIA 组中,69.77%(n = 30)的患者对 PIA 和医生咨询的偏好相同,11.63%(n = 5)的患者更倾向于 PIA,18.60%(n = 8)的患者更倾向于医生咨询。并且,患者的偏好与年龄、性别、教育水平等基线特征无关。
- 放射科医生对 PIA 的评价:放射科医生对 PIA 的整体质量、科学和临床证据、临床实用性和相关性、一致性以及时效性的评价都很高。例如,在整体质量方面,大部分评价为非常好(R1/R2:58.14%(n = 25)/55.81%(n = 24))和优秀(R1/R2:41.86%(n = 18)/44.19%(n = 19)) 。
综合研究结论和讨论部分,这项研究意义重大。一方面,PIA 能够有效地为患者提供 CT 检查相关信息,在信息传递的清晰度和患者理解度上与医生咨询效果相当,同时还能显著缩短后续医生咨询的时间,提高医疗效率。这表明 PIA 可以作为一种辅助工具,优化临床工作流程,减轻医生的工作负担。另一方面,研究也发现 PIA 在缓解患者担忧方面不如医生咨询。这是因为医生与患者的互动包含非语言交流、实时适应性和情感共鸣等因素,这些是目前的聊天机器人难以复制的。但这也为未来的研究指明了方向,如优化聊天机器人的提示以生成更具同理心的语言、探索自适应对话技术以及采用多模态方法模拟非语言线索等,有望进一步提升患者的安全感和满意度。
总的来说,该研究为 RAG 技术在医疗领域的应用提供了重要的参考,虽然目前 PIA 还不能完全取代医生在知情同意过程中的作用,但它作为一种辅助工具的潜力巨大,随着技术的不断完善,有望为精准医疗的发展注入新的活力。