综述：放射学基础模型——AI4HI网络的立场

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年08月08日 来源：Insights into Imaging 4.5

编辑推荐：

　　这篇综述探讨了基础模型（Foundation Models）在放射学中的应用潜力与挑战。作者团队来自AI4HI（Artificial Intelligence for Health Imaging）网络，指出这类基于大规模无标注数据训练的模型能减轻标注负担、提升公平性和泛化能力，但仍面临透明度不足、残留偏见等问题。提出通过去中心化临床验证框架和持续训练机制优化模型可靠性，构建更包容的医疗AI生态。文中详细分析了自监督学习（self-supervised learning）、视觉语言模型（VLM）等技术在胸部X光、前列腺MRI等场景的应用案例，强调需平衡技术创新与伦理合规（如EU AI Act）。

放射学基础模型的机遇与挑战

引言

医学影像在临床诊断中占据核心地位，但全球放射科医师短缺与工作负荷激增的矛盾日益突出。AI系统虽能辅助乳腺癌筛查、胸部X光结节识别等任务，但传统监督学习方法依赖标注数据，且存在泛化性差、人口统计学偏差等问题。基础模型通过预训练（pre-training）海量无标注数据，为下游任务提供通用起点，有望突破这些瓶颈。

基础模型的技术革新

这类模型采用自监督学习技术，如图像-报告生成（图2）、掩码自动编码器（图3）和对比学习（图4）。以MedSAM为例，该模型基于Segment Anything Model（SAM）微调，仅需边界框提示即可完成精准医学图像分割。视觉语言模型（VLM）如LLaMa 3.2^?结合文本与图像理解，在零样本学习（zero-shot learning）中展现优势。

临床应用的独特挑战

与自然图像相比，医学影像存在数据规模（最大胸部X光数据集MIMIC-CXR仅35万例）、三维结构信息缺失、信号分布同质化等难题。RETFound等模型虽在西方人群表现优异，但迁移至亚洲人群时优势消失，揭示人口偏差的顽固性。大型语言模型（LLM）在医疗执照考试中表现亮眼，但实际应用中仍存在幻觉（hallucination）和灾难性遗忘（catastrophic forgetting）风险。

构建可信赖的AI生态

作者提出三大解决方案：

通过欧洲癌症影像网络（Cancer Image Europe）等联邦学习平台实现多中心数据协作；
采用FUTURE-AI框架确保模型公平性（fairness）、可追溯性（traceability）等六大原则；
开发开源模型如LLaMa^?增强透明度，符合欧盟《人工智能法案》对高风险AI系统的监管要求。

未来方向

基础模型仅是临床AI进化的起点。需建立涵盖放射科医师反馈的"人在环路"（human-in-the-loop）机制，并开发能识别自身局限性的"自我感知"模型。正如瑞典VAI-B项目所示，持续的外部验证与动态更新才是医疗AI可持续发展的关键。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号