基于大语言模型(LLM)的器官移植专科智能体(Agent)在移植后非工作时段(Off-Hours)自我管理中的真实世界分析:一项混合方法研究

《Current Medical Science》:Real-World Analysis of Organ Transplantation-Specific Agent Based on Large Language Model in Post-Transplant Self-Management During Off-Hours: A Mixed-Methods Study

【字体: 时间:2026年07月03日 来源:Current Medical Science 2.0

编辑推荐:

  摘要 研究目的:器官移植受者在非工作时段(Out-of-Hours, OOH)面临医疗支持的显著缺口。通用大语言模型(Large Language Models, LLMs)受到人工智能幻觉(AI hallucinations)影响,难以胜任复杂的移植后照护。

  
摘要
研究目的:器官移植受者在非工作时段(Out-of-Hours, OOH)面临医疗支持的显著缺口。通用大语言模型(Large Language Models, LLMs)受到人工智能幻觉(AI hallucinations)影响,难以胜任复杂的移植后照护。为此,研究人员构建了首个基于LLMs的移植后专科智能体,以应对上述问题。
研究方法:研究人员开发了名为Doctor Xiao Yi的专科“移植后人工智能智能体(post-transplant AI agent)”,并以医院通用智能体Nan Xiao Yi为对照开展了一项混合方法研究。数据来源包括2025年6月至12月的20,176条真实世界交互日志,以及对152例移植受者的横断面问卷调查。研究人员分析了使用模式的时间分布、提问类型以及影响患者行为的因素。
研究结果:与Nan Xiao Yi不同,Doctor Xiao Yi在OOH期间持续活跃,并于凌晨4:00出现显著使用高峰(P < 0.001)。通用智能体主要处理预约等行政事务,而专科智能体则提供饮食、症状和用药等临床支持。问卷显示,60.5%的移植患者因在OOH不愿打扰人类医生而使用智能体;63.8%对专科智能体的回答表示满意;48.0%表示会根据人工智能(Artificial Intelligence, AI)建议决定是否进一步就医。
研究结论:该专科AI智能体有效填补了移植受者在OOH期间的医疗与心理服务缺口。基于“双源知识库 + GraphRAG + 多智能体框架”架构,该专科智能体能够为移植后照护提供安全、可靠的支持。
器官移植是终末期器官衰竭患者延长生命的重要手段,但手术成功仅是长期康复的起点。移植受者在术后常面临持续的生理与心理双重负担:睡眠障碍、血压波动、夜尿增多等症状虽不常需紧急干预,却显著降低生活质量;同时约三分之一受者合并抑郁、焦虑或创伤后应激障碍(Post-Traumatic Stress Disorder, PTSD)。身心不适交织,使出院后的患者处于高度脆弱状态。在家康复期间,这种脆弱性在非工作时段(Out-of-Hours, OOH)被进一步放大:深夜、凌晨及节假日出现不适时,患者常陷入“权威依赖型决策困境”——既急需专业指导以缓解焦虑,又因急诊就诊流程繁琐、互联网医院难以即时联系主管医生而求助无门,导致延误处理或不当处置的风险上升。近年来,大语言模型(Large Language Models, LLMs)在医学考试中展现出潜力,但通用模型面对复杂临床场景时易产生“幻觉”,缺乏器官移植领域的深度知识与同理心,难以替代专科医生。因此,构建面向实体器官移植术后管理的专科AI智能体成为迫切需求。该研究发表于《Current Medical Science》。

为填补上述缺口,研究人员自主研发了首个“移植后AI智能体”Doctor Xiao Yi,提供24小时连续医疗支持,并与医院通用智能体Nan Xiao Yi进行对照。研究采用混合方法设计: retrospectively分析2025年6月至12月20,176条真实交互日志,并对152例移植受者开展横断面问卷调查,评估专科智能体在OOH期间提供医疗-心理双重支持的效果,并探讨其在优化医院资源配置中的潜力。研究所用关键技术方法包括:基于通义千问大语言模型(LLM)进行器官移植领域微调,构建“双源权威知识库 + 图检索增强生成(GraphRAG)+ 多智能体协同推理”架构,并配置多级风险防御网络(MLRDN)实现动态安全管理;数据来源为中南医院匿名化交互日志及平台随机弹窗问卷。

研究主要结果如原文四个小标题所示。

“人口统计学特征与时间模式:‘夜间哨兵’效应”
在20,176条有效日志中,Doctor Xiao Yi仅占6.4%,却呈现出与Nan Xiao Yi截然不同的使用人群与时间分布。专科智能体用户年龄中位数约40岁,显著低于通用智能体的约50岁,男性占比超60%,与实体器官移植受者流行病学性别分布一致,说明其精准触达目标人群。时间分布上,Nan Xiao Yi呈典型门诊工作时间模式,而Doctor Xiao Yi在凌晨4:00出现显著高峰(P < 0.001),该时段交互量约占日总量的3.0%,约为通用智能体的15倍,揭示了移植受者在深夜存在被传统医疗体系忽视的照护需求。

“功能定位:行政门户与数字健康伙伴”
日志主题分析显示,Nan Xiao Yi以“预约挂号”(43.1%)和“一般咨询”(33.5%)为主,扮演医院行政门户角色;而Doctor Xiao Yi的“饮食与生活方式”咨询占41.5%,“一般咨询”占43.4%,另有“用药”(5.0%)和“检验结果”(4.7%)等具体临床问题,体现出其作为移植受者日常自我管理“数字健康伙伴”的功能定位。

“弥合服务缺口:OOH服务分析”
聚焦18:00至次日8:00的OOH时段,Nan Xiao Yi仍以“预约挂号”(42.3%)为主,反映患者利用其规划次日就诊行程;Doctor Xiao Yi则以“一般咨询”(42.9%)和“饮食与生活方式”(40.5%)为主,深层分析显示多为术后发热、运动时机等长尾临床问题。在22:00至6:00的深夜窗口,“饮食禁忌”和“急性症状”占比升至52.4%,进一步证实其有效填补了人力不可及时段的医疗服务真空。

“用户体验与动机驱动因素”
针对152例移植受者的调查显示,53.3%为术后2年以上的长期存活者,72.4%具有高中及以上文化程度,平均满意度达8.7分(满分10分),显示出较高的接受度。使用动机方面,60.5%因“不愿打扰医生”而在OOH咨询AI,55.3%因突发不适感到焦虑,提示Doctor Xiao Yi发挥了“心理安全阀”作用;73.0%因不信任碎片化网络信息而求助于该权威平台,凸显双源知识库的价值。在就医决策上,63.8%表示AI影响了其就医意愿,其中48.0%表示“视AI建议而定”,15.8%认为“无需就诊”。需要注意的是,这些均为主观行为意向,而非实际急诊就诊减少的客观测量。

讨论部分首先指出,移植受者因多病共存、多重用药而具有刚性的OOH医疗需求。Doctor Xiao Yi凌晨4:00的“夜间哨兵”效应与“权威依赖”相关:患者,尤其老年患者,常因担心被医护人员视为“小题大做”而压抑求医诉求;AI的非人属性降低了社会压力,促使患者披露敏感问题,并在深夜提供情绪缓冲。然而,这种数字缓冲是否能转化为实际不良事件减少,仍需通过客观指标加以验证。在技术可信度方面,通用LLM易产生“幻觉”,而本研究通过“双源知识库 + GraphRAG”将生成内容锚定于国家级器官移植指南与本中心十余年随访数据,同时采用人在回路(human-in-the-loop)更新机制,这正是73%患者愿意信任该平台的根本原因。关于安全边界,研究人员明确将AI定位为“临床副驾驶(copilot)”而非“机长(captain)”:MLRDN可在体温>38.5°C、黑便、胸痛等高危场景触发熔断机制,引导患者线下急诊;对免疫抑制剂等高风险药物,系统自动拦截直接剂量调整建议并强制提示咨询医生或药师。在资源配置方面,多数咨询集中在饮食康复等非核心问题,63.8%的行为意向提示其具备预检分诊潜力,但实际减少非必要门诊与急诊就诊仍需后续入院记录研究验证。讨论同时坦承研究的局限性:横断面样本存在选择偏倚,结论反映主观意向;数字鸿沟可能使老年低技术素养群体被排除;云端推理与本地隐私的平衡、AI生活方式建议导致不良事件时的责任归属仍待法律完善。

研究结论指出,本研究首次在器官移植领域提供了专科AI智能体可行性与高接受度的真实世界证据。技术上,“双源知识库 + GraphRAG + 多智能体框架”架构有效降低了通用LLM的“幻觉”风险,建立了移植后照护所需的信任机制。研究人员识别出独特的“夜间哨兵”效应,表明Doctor Xiao Yi能够连接传统医疗的“时间盲点”,在人力不可及之时提供关键的生理与心理缓冲;而通用智能体Nan Xiao Yi仅相当于行政助手。尽管如此,未来仍需开展以前瞻性客观临床终点为基础的研究,以评估其对实际医疗利用及远期疗效的真实影响。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号