基于大语言模型（LLM）的器官移植专科智能体（Agent）在移植后非工作时段（Off-Hours）自我管理中的真实世界分析：一项混合方法研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Current Medical Science》：Real-World Analysis of Organ Transplantation-Specific Agent Based on Large Language Model in Post-Transplant Self-Management During Off-Hours: A Mixed-Methods Study

【字体：大中小】 时间：2026年07月03日 来源：Current Medical Science 2.0

编辑推荐：

　　摘要研究目的：器官移植受者在非工作时段（Out-of-Hours, OOH）面临医疗支持的显著缺口。通用大语言模型（Large Language Models, LLMs）受到人工智能幻觉（AI hallucinations）影响，难以胜任复杂的移植后照护。

摘要
研究目的：器官移植受者在非工作时段（Out-of-Hours, OOH）面临医疗支持的显著缺口。通用大语言模型（Large Language Models, LLMs）受到人工智能幻觉（AI hallucinations）影响，难以胜任复杂的移植后照护。为此，研究人员构建了首个基于LLMs的移植后专科智能体，以应对上述问题。
研究方法：研究人员开发了名为Doctor Xiao Yi的专科“移植后人工智能智能体（post-transplant AI agent）”，并以医院通用智能体Nan Xiao Yi为对照开展了一项混合方法研究。数据来源包括2025年6月至12月的20,176条真实世界交互日志，以及对152例移植受者的横断面问卷调查。研究人员分析了使用模式的时间分布、提问类型以及影响患者行为的因素。
研究结果：与Nan Xiao Yi不同，Doctor Xiao Yi在OOH期间持续活跃，并于凌晨4:00出现显著使用高峰（P < 0.001）。通用智能体主要处理预约等行政事务，而专科智能体则提供饮食、症状和用药等临床支持。问卷显示，60.5%的移植患者因在OOH不愿打扰人类医生而使用智能体；63.8%对专科智能体的回答表示满意；48.0%表示会根据人工智能（Artificial Intelligence, AI）建议决定是否进一步就医。
研究结论：该专科AI智能体有效填补了移植受者在OOH期间的医疗与心理服务缺口。基于“双源知识库 + GraphRAG + 多智能体框架”架构，该专科智能体能够为移植后照护提供安全、可靠的支持。

器官移植是终末期器官衰竭患者延长生命的重要手段，但手术成功仅是长期康复的起点。移植受者在术后常面临持续的生理与心理双重负担：睡眠障碍、血压波动、夜尿增多等症状虽不常需紧急干预，却显著降低生活质量；同时约三分之一受者合并抑郁、焦虑或创伤后应激障碍（Post-Traumatic Stress Disorder, PTSD）。身心不适交织，使出院后的患者处于高度脆弱状态。在家康复期间，这种脆弱性在非工作时段（Out-of-Hours, OOH）被进一步放大：深夜、凌晨及节假日出现不适时，患者常陷入“权威依赖型决策困境”——既急需专业指导以缓解焦虑，又因急诊就诊流程繁琐、互联网医院难以即时联系主管医生而求助无门，导致延误处理或不当处置的风险上升。近年来，大语言模型（Large Language Models, LLMs）在医学考试中展现出潜力，但通用模型面对复杂临床场景时易产生“幻觉”，缺乏器官移植领域的深度知识与同理心，难以替代专科医生。因此，构建面向实体器官移植术后管理的专科AI智能体成为迫切需求。该研究发表于《Current Medical Science》。

为填补上述缺口，研究人员自主研发了首个“移植后AI智能体”Doctor Xiao Yi，提供24小时连续医疗支持，并与医院通用智能体Nan Xiao Yi进行对照。研究采用混合方法设计： retrospectively分析2025年6月至12月20,176条真实交互日志，并对152例移植受者开展横断面问卷调查，评估专科智能体在OOH期间提供医疗-心理双重支持的效果，并探讨其在优化医院资源配置中的潜力。研究所用关键技术方法包括：基于通义千问大语言模型（LLM）进行器官移植领域微调，构建“双源权威知识库 + 图检索增强生成（GraphRAG）+ 多智能体协同推理”架构，并配置多级风险防御网络（MLRDN）实现动态安全管理；数据来源为中南医院匿名化交互日志及平台随机弹窗问卷。

研究主要结果如原文四个小标题所示。

“人口统计学特征与时间模式：‘夜间哨兵’效应”
在20,176条有效日志中，Doctor Xiao Yi仅占6.4%，却呈现出与Nan Xiao Yi截然不同的使用人群与时间分布。专科智能体用户年龄中位数约40岁，显著低于通用智能体的约50岁，男性占比超60%，与实体器官移植受者流行病学性别分布一致，说明其精准触达目标人群。时间分布上，Nan Xiao Yi呈典型门诊工作时间模式，而Doctor Xiao Yi在凌晨4:00出现显著高峰（P < 0.001），该时段交互量约占日总量的3.0%，约为通用智能体的15倍，揭示了移植受者在深夜存在被传统医疗体系忽视的照护需求。

“功能定位：行政门户与数字健康伙伴”
日志主题分析显示，Nan Xiao Yi以“预约挂号”（43.1%）和“一般咨询”（33.5%）为主，扮演医院行政门户角色；而Doctor Xiao Yi的“饮食与生活方式”咨询占41.5%，“一般咨询”占43.4%，另有“用药”（5.0%）和“检验结果”（4.7%）等具体临床问题，体现出其作为移植受者日常自我管理“数字健康伙伴”的功能定位。

“弥合服务缺口：OOH服务分析”
聚焦18:00至次日8:00的OOH时段，Nan Xiao Yi仍以“预约挂号”（42.3%）为主，反映患者利用其规划次日就诊行程；Doctor Xiao Yi则以“一般咨询”（42.9%）和“饮食与生活方式”（40.5%）为主，深层分析显示多为术后发热、运动时机等长尾临床问题。在22:00至6:00的深夜窗口，“饮食禁忌”和“急性症状”占比升至52.4%，进一步证实其有效填补了人力不可及时段的医疗服务真空。

“用户体验与动机驱动因素”
针对152例移植受者的调查显示，53.3%为术后2年以上的长期存活者，72.4%具有高中及以上文化程度，平均满意度达8.7分（满分10分），显示出较高的接受度。使用动机方面，60.5%因“不愿打扰医生”而在OOH咨询AI，55.3%因突发不适感到焦虑，提示Doctor Xiao Yi发挥了“心理安全阀”作用；73.0%因不信任碎片化网络信息而求助于该权威平台，凸显双源知识库的价值。在就医决策上，63.8%表示AI影响了其就医意愿，其中48.0%表示“视AI建议而定”，15.8%认为“无需就诊”。需要注意的是，这些均为主观行为意向，而非实际急诊就诊减少的客观测量。

讨论部分首先指出，移植受者因多病共存、多重用药而具有刚性的OOH医疗需求。Doctor Xiao Yi凌晨4:00的“夜间哨兵”效应与“权威依赖”相关：患者，尤其老年患者，常因担心被医护人员视为“小题大做”而压抑求医诉求；AI的非人属性降低了社会压力，促使患者披露敏感问题，并在深夜提供情绪缓冲。然而，这种数字缓冲是否能转化为实际不良事件减少，仍需通过客观指标加以验证。在技术可信度方面，通用LLM易产生“幻觉”，而本研究通过“双源知识库 + GraphRAG”将生成内容锚定于国家级器官移植指南与本中心十余年随访数据，同时采用人在回路（human-in-the-loop）更新机制，这正是73%患者愿意信任该平台的根本原因。关于安全边界，研究人员明确将AI定位为“临床副驾驶（copilot）”而非“机长（captain）”：MLRDN可在体温>38.5°C、黑便、胸痛等高危场景触发熔断机制，引导患者线下急诊；对免疫抑制剂等高风险药物，系统自动拦截直接剂量调整建议并强制提示咨询医生或药师。在资源配置方面，多数咨询集中在饮食康复等非核心问题，63.8%的行为意向提示其具备预检分诊潜力，但实际减少非必要门诊与急诊就诊仍需后续入院记录研究验证。讨论同时坦承研究的局限性：横断面样本存在选择偏倚，结论反映主观意向；数字鸿沟可能使老年低技术素养群体被排除；云端推理与本地隐私的平衡、AI生活方式建议导致不良事件时的责任归属仍待法律完善。

研究结论指出，本研究首次在器官移植领域提供了专科AI智能体可行性与高接受度的真实世界证据。技术上，“双源知识库 + GraphRAG + 多智能体框架”架构有效降低了通用LLM的“幻觉”风险，建立了移植后照护所需的信任机制。研究人员识别出独特的“夜间哨兵”效应，表明Doctor Xiao Yi能够连接传统医疗的“时间盲点”，在人力不可及之时提供关键的生理与心理缓冲；而通用智能体Nan Xiao Yi仅相当于行政助手。尽管如此，未来仍需开展以前瞻性客观临床终点为基础的研究，以评估其对实际医疗利用及远期疗效的真实影响。

联系信箱：

粤ICP备09063491号

热点排行