编辑推荐:
医学影像分析在医疗领域至关重要,但手动处理既耗时又昂贵。研究人员开展了 “深度学习在医学 X 射线、MRI 和超声图像分类任务中的应用” 的研究。结果表明,深度学习在医学影像分类应用广泛但存在局限,为后续研究指明方向,助力医学影像诊断智能化发展。
在医疗领域,医学影像承载着大量关键信息,是疾病诊断的重要依据。然而,传统的医学影像分析主要依赖人工,不仅成本高昂、耗费时间,而且极易受到主观因素的影响,导致准确性参差不齐。随着人工智能技术的蓬勃发展,深度学习逐渐崭露头角,为医学影像分类带来了新的曙光。但深度学习在医学影像分类的实际应用中,仍面临着诸多难题,如数据集的质量与规模、模型的复杂性与可解释性等。为了深入探究深度学习在医学影像分类中的应用现状与发展方向,来自阿尔巴尼亚地拉那大学和瑞典林奈大学的研究人员开展了相关研究,其成果发表于《BMC Medical Imaging》。
研究人员采用了文献计量学和系统评价的方法,全面检索了多个知名数据库,筛选出 2014 - 2024 年间的 80 篇相关研究。在数据收集阶段,对这些研究进行了细致的梳理和分析,从疾病类型、影像模态、数据集特征等多个维度进行信息提取。
研究结果
- 疾病与解剖部位分布:研究发现,肺部、脑部和乳腺相关疾病是研究的热点,分别占比 34%、31% 和 10%。其中,肺部疾病如 COVID - 19、肺炎和肺结核,脑部疾病如阿尔茨海默病、痴呆和脑肿瘤,以及乳腺疾病如乳腺癌等备受关注。而肝脏、甲状腺、骨骼等部位的疾病研究相对较少1。
- 影像模态分布:在医学影像模态方面,X 射线的使用频率最高(44%),主要用于肺部疾病诊断;MRI 次之(35%),常用于脑部疾病研究;超声的应用占比为 21%,多集中于乳腺疾病分类。同时,研究还发现,数据集样本量在 1K - 10K 之间的研究占比最多(50%),且随着样本量增加,公共数据集的使用频率上升,私人数据集则相应减少23。
- 图像预处理与增强技术:超过半数的研究(54%)同时采用了图像预处理和数据增强技术。常见的预处理技术包括图像归一化(55%)、图像 resize(40%)、灰度化(28%)和去噪(26%);常用的数据增强方法有图像旋转(41%)、水平 / 垂直翻转(36%)和缩放(15%)45。
- 模型架构与技术环境:研究中使用最广泛的深度学习模型是自定义卷积神经网络(CNN,36%),其次是混合模型(21%)。在技术环境方面,39% 的研究使用 Tensorflow 作为后端,结合 Keras 或 Google Colab 进行模型实现;18% 的研究单独使用 PyTorch。此外,ReLU 或 LeakyReLU 激活函数在隐藏层中应用广泛(54%),Softmax 函数则常用于最后输出层;Adam 优化器(46%)和随机梯度下降(SGD,18%)是主要的优化算法67。
- 模型性能与优势模型:在疾病分类中,EfficientNet 和自定义 CNN 表现出色。例如,EfficientNet 结合可解释人工智能(XAI)技术,在肺部疾病、乳腺癌等疾病分类中展现出高准确率和良好的可解释性;自定义 CNN 则凭借其灵活的架构设计,在多种疾病分类任务中取得优异成绩89。
研究结论与讨论
深度学习在医学 X 射线、MRI 和超声图像分类中已取得一定成果,但仍面临诸多挑战。数据集方面,存在样本量小、数据不平衡、缺乏患者历史信息等问题;模型方面,可解释性差、泛化能力不足等限制了其进一步发展。为应对这些挑战,研究人员建议采用多种数据增强方法,如合成少数过采样技术(SMOTE)、深度自适应实例重加权(DARI)和条件生成对抗网络(cGAN)等,同时充分利用预训练模型,并结合 XAI 技术提升模型的可解释性和泛化能力。
该研究系统全面地分析了深度学习在医学影像分类中的应用,为后续研究提供了重要参考,有助于推动深度学习在医学影像领域的进一步发展,提高疾病诊断的准确性和效率,具有重要的理论和实践意义。