重新审视模型原型:MedMNIST + 数据集带来的医学影像分类新突破

【字体: 时间:2025年03月06日 来源:Scientific Reports 3.8

编辑推荐:

  研究人员针对医学数据集问题,开展 MedMNIST + 数据集相关研究,为模型开发提供建议,推动领域发展。

  在当今科技飞速发展的时代,深度学习(DL)在众多领域都取得了令人瞩目的成就,从图像分类到自然语言处理,它的身影无处不在。然而,当深度学习试图踏入医学领域,助力医疗诊断时,却遭遇了重重阻碍。
一方面,医学数据集存在诸多问题。样本数量有限,就像用少量拼图碎片去拼凑一幅巨大的医学图像,难以展现全貌;而且图像采集条件差异大,如同从不同角度、用不同清晰度的相机拍摄同一物体,得到的结果千差万别,这使得基于监督学习的深度学习算法在推广应用时困难重重。另一方面,深度学习研究方向出现偏差,过于追求在少数有影响力的基准测试上的微小性能提升,却忽略了临床实际需求。这就好比只注重在特定考试中取得高分,却不考虑所学知识能否真正应用到实际工作中,导致大量研究成果无法有效转化为临床可用的工具。

为了解决这些难题,来自德国班贝格大学(University of Bamberg)和慕尼黑大学(Ludwig Maximilian University of Munich)的研究人员开展了一项重要研究。他们围绕 MedMNIST + 数据集展开,对多种传统深度学习模型和训练方案进行重新评估,旨在为模型开发和部署提供更有价值的建议。这项研究成果发表在《Scientific Reports》上,为医学影像分类领域带来了新的曙光。

研究人员在此次研究中主要运用了以下关键技术方法:

  1. 模型选择:选取了包括卷积神经网络(如 VGG16、AlexNet、ResNet-18、DenseNet-121、EfficientNet-B4)和视觉 Transformer(如 ViT-B/16 及其多种预训练变体)在内的多种模型1112
  2. 训练范式:采用了端到端训练(训练整个模型)、线性探测(仅训练分类头,冻结编码器)以及将 k 近邻(k-NN)分类器集成到预训练模型特征空间等多种训练方式13
  3. 数据集使用:基于 MedMNIST v2 扩展而来的 MedMNIST + 数据集,该数据集包含 12 个 2D 数据集,涵盖多种成像模态和分类任务,且具有不同的图像分辨率1

下面来看具体的研究结果:

  1. 基准评估:对所有模型在不同数据集、图像分辨率和训练方案下进行性能评估。结果显示,端到端训练在所有训练方案中总体性能最高;较高分辨率通常能提升模型性能,但从 128×128 像素提升到 224×224 像素时,性能提升逐渐饱和。此外,像 CLIP 和 DINO 这样更广泛的自监督预训练策略,对端到端训练模型性能提升不明显,但对线性探测和 k-NN 集成的性能有增强作用234
  2. 输入分辨率影响:进一步研究发现,虽然提高输入分辨率在一定程度上能提升模型性能,但从 128×128 到 224×224 分辨率的提升过程中,这种改善效果明显减弱。而且不同模型对分辨率变化的敏感度不同,ViT - 基于的模型对输入分辨率变化的敏感度低于卷积模型56
  3. 模型排名:在模型排名分析中,卷积模型在端到端训练的准确率方面始终优于基于 ViT 的模型,其中 VGG16 和 DenseNet-121 表现突出。而基于 ViT 的架构,尤其是经过 DINO 预训练的,在线性探测和 k-NN 方法中表现更优78
  4. 定量评估:通过非参数统计测试进行定量评估,证实了输入分辨率和训练方案对模型性能有显著影响。同时发现,不同数据集上模型的性能存在差异,DenseNet-121 和 DINO ViT-B/16 是表现较好的模型,而 SAM 由于其预训练任务与分类任务不匹配,性能相对较差910

在研究结论和讨论部分,此次研究具有多方面重要意义。首先,明确了端到端训练虽然性能最高,但计算成本高,而像 k-NN 这样的计算高效方法具有潜力,这为后续研究探索更高效的训练方式提供了方向。其次,发现较低分辨率图像在模型开发的原型阶段具有优势,既能节省计算资源,又能保持一定的准确性,有助于加快模型开发迭代速度。再者,强调了在不同训练方案下,卷积模型和 ViT 各有优势,这为根据具体任务选择合适模型提供了参考。此外,研究还指出了现有研究的局限性,如数据集的局限性、未评估模型的可解释性等,为后续研究指明了方向。

综上所述,这项研究通过对多种模型和训练方案在 MedMNIST + 数据集上的系统评估,挑战了传统的模型设计、训练和输入分辨率的假设,为医学影像分类领域的模型开发提供了重要的参考和指导,推动了该领域朝着更高效、更实用的方向发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号