
-
生物通官微
陪你抓住生命科技
跳动的脉搏
放射科医师如何监测AI应用?一项揭示监测现状与挑战的跨国访谈研究
【字体: 大 中 小 】 时间:2025年04月09日 来源:Journal of Imaging Informatics in Medicine
编辑推荐:
为解决放射科AI应用性能衰减风险及监测标准缺失问题,研究人员通过半结构化访谈调查欧美16位放射科医师,发现当前AI监测主要依赖人工回溯性比对,面临资源不足与方法论不统一等挑战。研究提出需建立多学科治理小组与混合监测方法,为制定临床AI监测指南提供实证依据,对保障AI安全应用具有重要意义。
在医疗AI浪潮席卷全球的背景下,放射科已成为人工智能技术应用的"前沿阵地"。截至2024年12月,美国FDA批准的1016个AI/ML医疗设备中,放射科独占777席(76%)。这些能提高效率、改善预后的"数字助手"却暗藏隐忧:扫描协议变更、设备更新或疾病谱变化都可能导致AI模型出现性能衰减(performance degradation),而训练数据的地理偏见更可能加剧健康不平等——例如美国深度学习算法的训练数据竟有超过半数来自加州、麻省和纽约三地。更棘手的是,业界对如何持续监测这些"会学习的工具"仍莫衷一是,正如英国临床放射学普查显示,虽然54%的医疗机构已使用AI工具,但监测实践却参差不齐。
为揭开放射科AI监测的现状迷雾,来自University College London的Jamie Chow与合作者开展了一项跨国质性研究。通过对6位美国及10位欧洲放射科医师的半结构化访谈,研究者发现当前监测实践仍处于初级阶段:最常见的"土办法"是人工回溯性比对AI结果与放射报告(manual retrospective review),仅1例使用自然语言处理(NLP)自动化提取诊断信息。资源匮乏、数据完整性差、厂商支持不足构成三大障碍,而AI治理小组的成熟度差异更导致监测标准碎片化。该研究创新性提出"混合方法监测框架",强调需根据应用场景风险等级定制监测频率,相关成果发表于《Journal of Imaging Informatics in Medicine》。
研究采用目的抽样法筛选36位具有AI经验的欧美放射科医师,最终16位完成30-60分钟虚拟访谈。访谈录音经Microsoft Teams自动转录后,通过NVivo软件进行主题分析(thematic analysis),采用Braun & Clarke的归纳法生成32个编码并聚类为6大主题。样本覆盖不同年资医师(10-19年经验者占多数)及主流AI应用场景(乳腺钼靶异常检测与胸部X线分析各8次提及)。
研究结果揭示六大发现:1)监测实践方面,62.5%受访者因AI尚未完全临床部署而暂未系统监测,人工比对占主导,仅P13采用NLP自动化监测;2)治理架构呈现异质性,英国存在信托医院与区域影像网络的双层治理冲突,而医学物理师(medical physicists)因其设备质控专长被推荐加入治理小组;3)监测指标应超越传统准确率(accuracy),涵盖先验模型评估(a priori model assessment)、可解释性(explainability)及患者结局等多元维度;4)挑战集中于资源短缺(P14坦言"需自愿无偿工作")、用户依从性差(P1指出反馈按钮存在选择偏倚)及数据治理壁垒;5)责任归属应厂商-医院共担,但P16强调"不能全交给厂商自查";6)改进建议包括设立临床冠军(clinical champion)角色、利用区域网络共享资源,以及参照ACR的ARCH-AI等国家标准。
典型案例生动展现实践困境:某英国医院为满足国家最优肺癌路径(NOLCP)的24小时报告时限,部署胸部X线AI辅助分诊,却陷入监测指标选择的困惑——是追踪AI-报告一致性?还是直接监测肺癌筛查转化率?这种"工具-目标"的错位恰折射出当前AI监测的普遍盲区。而P5关于脊椎MRI AI测量的见解更具启发性:"我们的职责不是验证测量值本身,而是确认测量方式——标记是否准确贴合解剖结构"。
讨论部分尖锐指出三大矛盾:技术快速迭代与监管滞后的时差、统计监测方法(如特征重要性分析)与临床认知的鸿沟,以及FDA预设变更控制计划(PCCP)带来的新挑战。研究者强调,随着卷积神经网络(CNN)向多模态基础模型(foundation models)演进,监测体系更需前瞻性设计。尽管存在样本量较小(n=16)及未涵盖患者代表等局限,该研究仍为AI质量保证(quality assurance)提供了关键路线图:建立多学科治理、采用混合监测方法、优先高风险场景,这三项建议对实现《柳叶刀数字健康》提出的"医疗算法审计"(medical algorithmic audit)具有重要实践价值。
这项研究犹如一盏探照灯,既照亮了放射科AI监测路上的沟坎,也指明了前进方向。当AI应用从"新奇玩具"成长为"临床伙伴",完善的监测体系将成为守护患者安全的生命线。正如作者援引的SMACTR框架所示,唯有通过持续的范围界定(Scoping)、测试(Testing)与反思(Reflection),才能让AI这匹"骏马"始终行驶在正确的轨道上。
生物通微信公众号
知名企业招聘