编辑推荐:
在临床诊断中,患者信息采集效率低、耗时长,现有方法存在不足。研究人员开发了基于大语言模型(LLMs)的两阶段主动式对话生成系统。实验表明该系统表现出色,能高效采集信息,为临床诊断流程优化提供有力支持。
临床诊断是一场关乎生命健康的 “精密战役”,准确高效地收集患者信息则是打赢这场战役的关键 “武器”。然而在实际的医疗场景中,收集那些对疾病诊断极为重要的信息,比如患者症状、过往手术史、医疗检测证据以及生活习惯等,往往困难重重。目前,这些关键信息主要依靠医护人员与患者手动访谈或者常规询问来获取,不仅耗费大量时间和精力,而且患者可能会因为反复被问而感到疲惫,从而导致回答不准确,严重影响诊断效率和准确性。
虽然有研究尝试利用问卷调查来辅助病史采集,但这种方式存在明显的局限性,无法完全替代临床访谈,对于某些疾病并不适用。同时,计算机辅助诊断在疾病分析方面取得了一定进展,像异常检测、疾病预测等,但在诊断数据采集领域却进展缓慢。在自然语言处理(NLP)飞速发展的今天,直接将问答(QA)任务的解决方案应用到诊断查询生成上,也面临诸多挑战。因为诊断对话系统需要主动向患者提问以收集疾病相关信息,而不是像传统 QA 系统那样被动回答问题,并且简单地将查询生成视为单一查询预测任务,会导致查询缺乏灵活性,难以全面收集诊断信息。
为了解决这些难题,来自未知研究机构的研究人员开展了一项极具意义的研究。他们致力于开发一种基于大语言模型(LLMs)的主动式对话系统,旨在通过主动对话自动收集诊断信息,辅助临床工作流程。
研究人员为实现这一目标,运用了一系列关键技术方法。他们构建了一个独特的两阶段推荐结构,包括查询生成和候选排序环节。在查询生成阶段,充分利用大语言模型的能力生成可能的查询;在候选排序阶段,通过精心设计的策略,参考真实世界诊断对话数据集中的病史信息,对生成的查询进行筛选和排序,以此提高模型在疾病诊断方面的专业知识和推理能力。同时,该系统还包含关键的医生代理模型和交互式患者代理模型,医生代理负责主动提出与疾病相关的问题,患者代理则模拟患者回应,两者相互配合完成对话过程。
在研究结果方面,研究人员进行了全面的实验评估:
- 实验设置:研究人员精心挑选了合适的实验数据集,对模型的各项参数进行了合理设置,确保实验的科学性和可靠性。
- 对话质量评估:通过实验发现,该模型生成的医疗对话在风格上更接近真实医生的对话。在对话过程中,表现出更高的专业性、有效性和安全性,能够与患者进行流畅且有针对性的交流。
- 诊断信息检索性能:模型在检索诊断信息方面表现优异,能够通过多轮对话深入挖掘患者的疾病相关信息,无论是症状、过往手术情况还是其他重要线索,都能有效收集,为后续诊断提供有力支持。
- 消融研究结果:通过消融研究发现,模型中的各个组件,如医生代理、候选排序策略以及患者代理,对于提升模型性能都起着不可或缺的作用。去掉任何一个关键组件,模型在生成对话和收集信息方面的能力都会受到显著影响。
- 代表性结果展示:展示的代表性结果进一步证实了模型在不同场景下的良好表现,能够适应复杂多样的临床情况,稳定地收集诊断信息。
研究结论和讨论部分充分肯定了该研究的重要意义。实验结果表明,研究人员提出的医生代理、候选排序策略和患者代理,成功实现了模拟临床对话的目标。该模型不依赖任何疾病或语言的先验知识,具有广泛的通用性,能够适用于不同类型的疾病和语言环境。在 BLEU 和 ROUGE 等评估指标上,该模型得分较高,说明经过微调以及候选排序后,能更好地模仿真实世界对话风格。这一研究成果为临床信息采集提供了全新的思路和方法,有望大幅提升临床诊断效率,优化患者就医体验,推动医疗行业智能化发展,在《Expert Systems with Applications》发表后,也将为相关领域的研究提供重要的参考和借鉴。