
-
生物通官微
陪你抓住生命科技
跳动的脉搏
放射科AI模型临床评估与部署标准化框架的构建与实践
【字体: 大 中 小 】 时间:2025年06月06日 来源:Journal of the American College of Radiology 4.0
编辑推荐:
为解决AI模型在放射科临床部署中的性能评估、资源分配及投资回报率(ROI)等核心问题,美国大型学术中心Radiology AI Council开发了一套标准化评估框架(rubric),通过8个月内对13个模型的验证,提出需超越传统性能指标,强调透明化与客观性评估,以提升AI在放射学工作流中的效能与安全性。
在医疗人工智能(AI)迅猛发展的今天,放射科作为AI技术落地的重点领域,却面临模型评估标准缺失、临床部署混乱的困境。不同AI模型在真实场景中的表现参差不齐,医院在资源分配和投资回报率(ROI)计算时缺乏科学依据,甚至可能因模型缺陷引发安全隐患。这一现状促使美国某大型学术中心的Radiology AI Council开展了一项开创性研究,旨在建立一套覆盖全生命周期的AI模型评估体系。相关成果发表于《Journal of the American College of Radiology》。
研究团队采用多学科协作模式,开发了包含五大维度的评估框架(rubric):真实世界性能(Real-world Performance)、工作流整合(Workflow Implementation)、资源需求(Resource Allocation)、经济效益(ROI)及系统级影响(Health System Impact)。通过前瞻性队列研究,对13个放射科AI模型进行了为期8个月的跟踪评估,样本来源于该中心日常临床数据。
研究结果显示,在模型性能验证部分,约23%的模型在真实场景中表现显著低于厂商宣称指标(p<0.05)。工作流整合评估发现,DICOM(Digital Imaging and Communications in Medicine)兼容性不足是导致35%模型部署延迟的主因。经济效益分析揭示,仅38%的模型能在12个月内实现正向ROI。值得注意的是,通过该框架筛选的模型临床采纳率提升至92%,较传统评估方法提高41%。
结论部分强调,该研究首次将技术性能、临床适用性与卫生经济学指标纳入统一评估体系。提出的标准化框架(rubric)不仅解决了放射科AI"落地难"的痛点,更开创了医疗器械级AI评估的新范式。特别是对模型透明度(Transparency)和客观性(Objectivity)的强调,为行业监管提供了可量化的参考标准。这项研究对推动AI在医疗领域的规范化应用具有里程碑意义,其方法论可扩展至病理学、心脏病学等其他医学影像相关学科。
生物通微信公众号
知名企业招聘