
-
生物通官微
陪你抓住生命科技
跳动的脉搏
Radio DINO:基于自监督学习的医学影像分析基础模型及其在精准放射组学中的应用
【字体: 大 中 小 】 时间:2025年06月29日 来源:Computers in Biology and Medicine 7.0
编辑推荐:
本研究针对传统放射组学(radiomics)面临的手工特征工程依赖性强、高维数据挑战等问题,开发了基于DINO/DINOv2自监督学习(SSL)的Radio DINO基础模型。通过在RadImageNet数据集预训练,该模型在MedMNISTv2多项临床任务中超越现有方法,准确率提升1.97-3%,AUC达95.55%,并实现病灶区域的可视化定位,为资源有限的医疗机构提供了先进的放射组学分析工具。
医学影像分析正经历着由人工智能驱动的革命性变革,其中放射组学(radiomics)作为新兴领域,通过提取医学图像中的定量特征来揭示疾病特征。然而传统方法面临三大瓶颈:依赖专家手工设计特征、高维数据与有限样本量的矛盾、以及模型泛化能力不足。这些问题严重制约了放射组学在临床诊断、预后评估等关键场景的应用价值。
为突破这些限制,研究人员开发了Radio DINO系列基础模型(foundation model)。这项创新性研究采用自监督学习(Self-Supervised Learning, SSL)框架,基于DINO和DINOv2算法,在包含135万张多模态医学图像的RadImageNet数据集上进行预训练。研究团队设计了系统的评估方案,在MedMNISTv2基准测试的5个子任务中验证模型性能,其中在BreastMNIST数据集准确率达91.67%,较现有最佳模型提升1.97个百分点;在腹部CT器官分类任务(OrganAMNIST等)中平均提升3%。论文发表在《Computers in Biology and Medicine》期刊。
关键技术方法包括:1) 基于Vision Transformer(ViT)架构构建不同规模的Radio DINO模型;2) 采用自蒸馏(self-distillation)策略进行无监督预训练;3) 在RadImageNet数据集(含CT/MR/超声等165类影像)进行200个epoch训练;4) 通过kNN分类、UMAP降维等方法评估特征质量;5) 在BUSI乳腺癌数据集验证分割性能(Dice系数71.7%)。
研究结果部分,作者通过多项实验系统验证了模型性能:
特征评估:kNN分类显示Radio DINO tiny在RadImageNet测试集达到66.2%准确率,超越ViT base MAE等对比模型。PCA可视化显示模型能自动区分脑组织、颅骨等解剖结构。
分类性能:在BreastMNIST乳腺超声分类中,Radio DINO small的AUC达95.55%;肺炎检测任务(PneumoniaMNIST)中关注到支气管充气征等关键征象。
特征可视化:Grad-CAM热图显示模型能准确定位乳腺结节等病变区域,与放射科医生的诊断关注点高度一致。
跨尺度评估:输入分辨率从56×56到448×448变化时,Radio DINO base的F1分数保持81.12%,显示优秀的尺度鲁棒性。
分割应用:在BUSI乳腺超声数据集,冻结参数的Radio DINO small sp分割头取得56.5% IoU,证明预训练特征的强迁移能力。
讨论部分指出,Radio DINO的创新性体现在三个方面:首先,通过SSL避免了传统放射组学对标注数据的依赖;其次,模型在保持ViT架构优势的同时,通过医学影像专用预训练提升了特征表达能力;最后,可视化技术增强了模型决策的可解释性,为临床落地奠定基础。局限性包括对训练数据质量敏感、计算资源需求较高等。
这项研究的重要意义在于:为医学影像分析提供了首个基于DINO框架的专用基础模型,在保持模型性能的同时显著降低对标注数据的依赖。特别是使资源有限的医疗机构也能获得先进的放射组学分析工具,对推动AI在医疗领域的普惠应用具有重要价值。未来工作将聚焦多模态数据融合和轻量化部署,进一步推动该技术在临床实践中的转化应用。
生物通微信公众号
知名企业招聘