
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:放射学基础模型——AI4HI网络的立场
【字体: 大 中 小 】 时间:2025年08月08日 来源:Insights into Imaging 4.5
编辑推荐:
这篇综述探讨了基础模型(Foundation Models)在放射学中的应用潜力与挑战。作者团队来自AI4HI(Artificial Intelligence for Health Imaging)网络,指出这类基于大规模无标注数据训练的模型能减轻标注负担、提升公平性和泛化能力,但仍面临透明度不足、残留偏见等问题。提出通过去中心化临床验证框架和持续训练机制优化模型可靠性,构建更包容的医疗AI生态。文中详细分析了自监督学习(self-supervised learning)、视觉语言模型(VLM)等技术在胸部X光、前列腺MRI等场景的应用案例,强调需平衡技术创新与伦理合规(如EU AI Act)。
引言
医学影像在临床诊断中占据核心地位,但全球放射科医师短缺与工作负荷激增的矛盾日益突出。AI系统虽能辅助乳腺癌筛查、胸部X光结节识别等任务,但传统监督学习方法依赖标注数据,且存在泛化性差、人口统计学偏差等问题。基础模型通过预训练(pre-training)海量无标注数据,为下游任务提供通用起点,有望突破这些瓶颈。
基础模型的技术革新
这类模型采用自监督学习技术,如图像-报告生成(图2)、掩码自动编码器(图3)和对比学习(图4)。以MedSAM为例,该模型基于Segment Anything Model(SAM)微调,仅需边界框提示即可完成精准医学图像分割。视觉语言模型(VLM)如LLaMa 3.2?结合文本与图像理解,在零样本学习(zero-shot learning)中展现优势。

临床应用的独特挑战
与自然图像相比,医学影像存在数据规模(最大胸部X光数据集MIMIC-CXR仅35万例)、三维结构信息缺失、信号分布同质化等难题。RETFound等模型虽在西方人群表现优异,但迁移至亚洲人群时优势消失,揭示人口偏差的顽固性。大型语言模型(LLM)在医疗执照考试中表现亮眼,但实际应用中仍存在幻觉(hallucination)和灾难性遗忘(catastrophic forgetting)风险。
构建可信赖的AI生态
作者提出三大解决方案:
通过欧洲癌症影像网络(Cancer Image Europe)等联邦学习平台实现多中心数据协作;
采用FUTURE-AI框架确保模型公平性(fairness)、可追溯性(traceability)等六大原则;
开发开源模型如LLaMa?增强透明度,符合欧盟《人工智能法案》对高风险AI系统的监管要求。
未来方向
基础模型仅是临床AI进化的起点。需建立涵盖放射科医师反馈的"人在环路"(human-in-the-loop)机制,并开发能识别自身局限性的"自我感知"模型。正如瑞典VAI-B项目所示,持续的外部验证与动态更新才是医疗AI可持续发展的关键。
生物通微信公众号
知名企业招聘