提示导向的环境人工智能（Prompt-directed Ambient Artificial Intelligence）用于头颈部多学科肿瘤委员会（Multidisciplinary Tumor Board）记录的自动化生成

《Annals of Oncology》：Prompt-directed ambient artificial intelligence for automated multidisciplinary tumor board documentation

【字体：大中小】 时间：2026年06月11日 来源：Annals of Oncology 65.4

编辑推荐：

　　背景：肿瘤委员会（Tumor Board）记录因多学科输入复杂而难以完成。用于医疗听写的环境人工智能（Ambient Artificial Intelligence, Ambient AI）利用生成式方法汇总语音数据，策略性提示（Prompting）可改善模型

背景：肿瘤委员会（Tumor Board）记录因多学科输入复杂而难以完成。用于医疗听写的环境人工智能（Ambient Artificial Intelligence, Ambient AI）利用生成式方法汇总语音数据，策略性提示（Prompting）可改善模型输出。研究人员评估了提示导向的环境人工智能（Prompt-directed Ambient AI）用于自动化肿瘤委员会记录，并将环境人工智能记录与人工手写记录进行比较。患者与方法：研究人员于2025年在一所三级诊疗机构开展前瞻性质量改进研究，评估环境人工智能对头颈部癌症多学科肿瘤委员会讨论的记录效果。主要干预措施为在病例讨论期间进行口头提示（Verbal Prompting）以提高记录质量。主要队列包括无提示环境人工智能组（Unprompted Ambient AI）和提示导向环境人工智能组（Prompt-directed Ambient AI）。配对比较亚组分析包含同一场会议中人工记录与环境人工智能记录的配对比较。研究人员使用改良MODe（Metric for Observation of Decision Making）量表评估记录质量，涵盖5个领域：人口学特征（Demographics）、肿瘤特征（Tumor Characteristics）、影像学发现（Radiology Findings）、病理学金标准（Pathology Findings）及讨论内容（Discussion），各条目按1–3分评分（1＝错误/遗漏，2＝部分记录，3＝完整记录）。结果：研究人员分析了4个队列共12场肿瘤委员会的记录结果——无提示环境人工智能组、提示导向环境人工智能组、人工记录组及内部验证组。主要队列中，提示导向环境人工智能较无提示环境人工智能提高了肿瘤特征领域评分（q＝0.042）及总分（p＝0.005），每例患者讨论时间无差异（p＝0.158）。配对比较中亚组分析显示，环境人工智能较人工记录在总分（p＜0.001）及讨论领域评分（q＜0.001）上更优，且每例患者行政记录时间更短（p＜0.001）。内部验证队列各域评分与提示导向组相当，具统计学可比性。结论：头颈部肿瘤委员会讨论期间实施定向提示（Directed Prompting）可改善环境人工智能生成摘要的质量且不延长讨论时间。与人工记录相比，环境人工智能在提升记录质量的同时减轻了行政负担。

《Annals of Oncology》刊载研究解读：提示导向环境人工智能（Prompt-directed Ambient AI）在头颈部多学科肿瘤委员会（Multidisciplinary Tumor Board）记录自动化中的应用

一、研究背景与立题依据

多学科肿瘤委员会（Multidisciplinary Tumor Board，下文简称Tumor Board）是集合外科肿瘤学、内科肿瘤学、放射肿瘤学、病理学、影像学及护理等多学科专家，针对特定患者因素进行讨论以制定精准肿瘤诊疗方案的重要平台，同时亦承担临床试验招募、法遵合规及生存规划指导功能，故准确完整的Tumor Board记录对后续诊疗团队沟通与参考至关重要。然而现行人工记录耗时冗长，常由低年资学员（Trainee）承担，易导致记录质量参差不齐及关键信息丢失。既往探索的记录策略依赖标准化人工摘要，效率与完整性均有限。环境人工智能（Ambient Artificial Intelligence, Ambient AI）平台借助自然语言处理（Natural Language Processing, NLP）及生成式人工智能对医患对话实时收音、转写并结构化生成临床笔记，已在门诊替代文书助理（Scribe）并改善医师职业倦怠与工作效率，但在Tumor Board这一多人实时多模态复杂讨论场景中应用尚缺乏探索。提示（Prompting）——即通过设计指令引导模型产出期望输出——若以口头提示形式嵌入Ambient AI平台，有望提升临床相关要素捕获率。本研究旨在建立一套不显著干扰Tumor Board既有工作流程的Ambient AI实施方案并评估其效果。

二、主要关键技术方法与队列设计

研究类型为前瞻性质量改进研究（Prospective Quality Improvement Study），2025年2月至10月于某三级诊疗机构开展，纳入每周例行头颈部癌Tumor Board会议。使用商用Ambient AI平台Abridge（Abridge AI Inc., Pittsburgh, PA；基于超10,000小时去标识化医患对话SOAP结构标注及50余专科医疗数据微调）通过Zoom录音后经平台处理生成结构化笔记。研究分三部分：(1)主要比较队列：先连续4场Tumor Board行无提示Ambient AI记录（Unprompted Ambient AI），据此制定标准化口头提示模板后，再连续4场行提示导向Ambient AI记录（Prompt-directed Ambient AI），由汇报医师在病例展示固定节点口头提示强调人口学、肿瘤特征、影像、病理及多学科推荐；(2)配对比较亚组：从主要队列中抽取2场会议，由盲法受训学员生成同期人工手写记录与Ambient AI记录配对比较；(3)内部验证队列：另取4场Tumor Board应用已定型的提示导向Ambient AI工作流检验可重复性。记录质量采用改良MODe（Metric for Observation of Decision Making）量表评分，含人口学特征、肿瘤特征（原发部位/组织学/TNM分期/HPV状态）、影像学发现（局部及远处）、病理学发现（神经周浸润/淋巴血管浸润/结外扩展）及讨论（各亚专科参与情况及治疗推荐）5个领域，各条目1分＝讨论过但错误或未记录、2分＝部分记录、3分＝完整记录；评分者盲法评估且经统一培训。行政时间指人工组参照录音手写整理耗时，Ambient AI组指平台处理时间及审核生成摘要并参照录音核对时间。统计方法含Mann-Whitney U检验、配对Wilcoxon符号秩检验及Benjamini-Hochberg假发现率（False Discovery Rate, FDR）校正。

三、研究结果

Cohort characteristics（队列特征）

共分析12场独特Tumor Board：无提示Ambient AI组4场（131例患者）、提示导向Ambient AI组4场（73例）、人工记录组2场（48例，取自主要队列）、内部验证组4场（81例）。最常见原发灶为口腔（30.2%）与口咽（26.7%）。提示导向组与无提示组在Tumor Board总时长（p=0.114）、每例讨论耗时（无提示2分57秒±1分58秒 vs 提示导向3分26秒±2分33秒，p=0.158）及每例行政时间（p=0.158）上均无显著差异；内部验证组与提示导向组上述指标亦无显著差异（p值分别为0.343、0.292、0.074）。

Primary cohort comparisons（主要队列比较：无提示 vs 提示导向Ambient AI）

提示导向Ambient AI较无提示Ambient AI显著提高肿瘤特征（Tumor Characteristics）领域均分（q=0.042），其中组织学（Histology）单项亦显著提升（q=0.021）；总分由2.88±0.20升至2.95±0.10（p=0.005）。人口学特征领域及年龄、合并症单项在提示后亦有提升（p值分别为0.022、0.036、0.048但未通过FDR校正）。讨论（Discussion）领域及影像学、病理学领域组间无显著差异。提示导向组内总分无随时间漂移趋势（OLS回归斜率0.0008点/天，p=0.41），说明提示工作流质量稳定。

Paired sub analysis（配对亚组分析：Ambient AI vs 人工记录）

Ambient AI组每例行政时间显著少于人工记录组（3分39秒±1分55秒 vs 5分36秒±1分58秒，p<0.001）。记录质量方面，Ambient AI总分显著高于人工记录（2.89±0.16 vs 2.76±0.23，p<0.001）；讨论（Discussion）领域Ambient AI显著优于人工记录（2.94±0.10 vs 2.69±0.29，q<0.001）；分项上病理科意见（Pathology input, q=0.016）及影像科意见（Radiology input, q<0.001）捕获率Ambient AI亦显著更佳。其余领域两组无显著差异。

Internal validation（内部验证）

内部验证队列与提示导向Ambient AI主要队列在总分（2.96±0.09 vs 2.95±0.10，p=0.948）及各域评分（经FDR校正后均无显著差异）上具可比性，证实提示导向Ambient AI工作流在不同批次Tumor Board中具有可重复表现。

四、讨论总结与结论翻译

讨论指出，Ambient AI此前多用于门诊或急诊一对一医患场景，本研究首次在前瞻性质控研究中将其引入复杂的多学科Tumor Board记录，并设置无提示vs提示导向对照、人工vs Ambient AI配对比较及内部验证三层次评估。无提示Ambient AI基线各域均分已>2.5表现良好，而标准化口头提示框架进一步明确讨论中临床要素，使肿瘤特征域及总分显著提升，且不延长讨论耗时——提示甚至可能间接规范Tumor Board陈述结构。相较人工记录，Ambient AI更全面捕获多学科讨论细节（尤讨论域及亚专科意见）且缩短行政耗时，可缓解学员负担与记录异质性。局限性含序列非随机设计潜在时期效应、评分量表未加权、未双人评分计算评者间信度、未系统审计错误类型及下游安全影响、仅用商用平台未作机构专属微调等；研究评估为"人在回路（Human-in-the-Loop）"核验模式而非完全自主记录。未来拟拓展至多类型Tumor Board、社区癌症中心及整合至电子健康档案（Electronic Health Record, EHR）。

结论译文：

Ambient AI软件Abridge可为Tumor Board记录提供实时综合性摘要。头颈部Tumor Board期间的定向提示（Directed Prompting）可在不显著延长患者讨论时间前提下明显改善AI生成摘要质量。与人工记录相比，Ambient AI记录在更全面捕获复杂Tumor Board讨论要素的同时减轻了行政负担。研究人员提供了一种可扩展、可推广的Ambient AI用于Tumor Board记录的工作流程。

热点排行