综述:乳腺X线摄影中乳腺癌检测的深度学习技术:全球与亚洲视角的系统文献综述

《BMC Cancer》:A systematic literature review on mammography: deep learning techniques for breast cancer detection with global and Asian perspectives

【字体: 时间:2025年10月23日 来源:BMC Cancer 3.4

编辑推荐:

  本综述系统梳理了2018-2023年间深度学习(DL)在乳腺X线摄影(Mammography)中应用的研究趋势,特别关注亚洲人群因乳腺密度高、发病早等独特挑战。文章揭示了当前模型训练数据主要基于高加索人群(>80%),存在显著的泛化性局限,并指出亚洲数据集在病灶检测、分割及乳腺密度评估方面的研究严重不足。作者呼吁未来研究需采用多样化数据集进行模型开发与验证,并加强临床测试的包容性,以推动全球乳腺癌筛查的公平性与准确性。

  

引言

乳腺癌(BC)已成为全球女性最常见的恶性肿瘤,据GLOBOCAN 2022数据,其发病率正迅速增长,在159个国家位居癌症首位。亚洲地区乳腺癌的流行病学特征与西方存在显著差异:发病年龄更早(平均早10年),且确诊时多为晚期。这一特点与亚洲女性乳腺密度较高密切相关,高密度组织不仅增加患癌风险,还会掩盖肿瘤影像,导致 mammography 的敏感性下降,误诊和漏诊率升高。
乳腺X线摄影作为早期筛查的金标准,在临床中广泛采用 mediolateral oblique(MLO)和 cranio-caudal(CC)两种投照体位,并依据乳腺影像报告和数据系统(BI-RADS)进行标准化分类。然而,亚洲人群较高的乳腺密度(常见于年轻女性)为影像判读带来巨大挑战,也凸显出对人工智能(AI)辅助诊断技术的迫切需求。近年来,深度学习技术尤其是卷积神经网络(CNN)、Transformer 及混合模型的发展,大幅提升了乳腺癌的诊断准确率,为改善筛查效果带来新希望。

研究方法与目标

本综述严格遵循 PRISMA 指南,系统检索了 Scopus 和 Web of Science 数据库中2018年1月至2023年11月间发表的文献,并补充检索了2024年至2025年的最新研究。初检获得1051篇文献,经筛选后最终纳入287篇进行定性分析。研究聚焦五大问题(RQ1–RQ5):深度学习在乳腺癌及乳腺密度检测、分割、分类中的方法与进展;亚洲人群应用中的特殊挑战;常用 mammography 数据集及其亚洲数据必要性;预处理与数据增强对模型鲁棒性的影响;现有不足与未来方向。

研究趋势与地理分布

2018年至2023年间,相关研究呈现爆发式增长,年发文量从15篇增至86篇。Springer、Elsevier 及 MDPI 是主要出版机构。国际合作网络呈现区域化聚集特点,亚洲国家之间合作密切,但与欧美团队交流有限。美国、中国、印度是发文量最多的国家,但亚洲地区总体研究规模仍远低于高加索人群。
关键词分析显示,“深度学习”“神经网络”“乳腺癌筛查”“乳腺X线摄影”等术语交叉频繁,反映技术研究与临床应用的深度融合。然而,“检测”“分割”相关关键词出现频率远低于“分类”,说明研究重点仍偏重诊断分类,对病灶定位与轮廓勾画等关键技术关注不足。

任务类型与人群差异

通过研究焦点图谱可清晰看出,基于深度学习的乳腺影像分析主要集中于三类任务:分类(区分良性/恶性、正常/异常等)、检测(识别病灶位置)和分割(像素级勾画病灶区域)。无论在病灶(Mass/Calcification)还是乳腺密度(Density)研究中,分类任务占比最高(病灶分类中亚洲占55%,高加索占53%),而检测与分割研究明显不足。
更值得关注的是人群间的不平衡:高加索数据集上的研究数量在病灶检测(72 vs 9)、分割(33 vs 8)和密度分析(24 vs 5)等方面均显著高于亚洲数据集,相差最高达8倍。非洲和大洋洲地区的研究几乎为空白。这种数据偏向导致当前大多数深度学习模型对高密度乳腺、年轻发病等亚洲典型特征适应性差,严重影响其在全球范围内的临床适用性。
BI-RADS 多类别分类研究尤其匮乏。多数研究仅进行二分类(良性/恶性)或三分类(正常/良性/恶性),全面涵盖 BI-RADS 0–6 类的研究寥寥无几。这与临床需精确区分不同病变等级的实际需求严重脱节。

技术进展与模型架构

在病灶检测方面,YOLO、Faster R-CNN 等目标检测算法已被广泛采用,新近研究开始探索 RetinaNet、图神经网络(GNN)和互学习(Reciprocal Learning)等先进框架。分割任务则从传统阈值法、区域生长法转向 U-Net 及其变体(如 ResU-SegNet、注意力 U-Net),并开始引入 coarse-to-fine Transformer 结构。分类模型中,除经典的 DenseNet、ResNet、EfficientNet 外,对抗性领域自适应(DADA)、多尺度 CNN 以及视觉 Transformer(ViT)也逐渐崭露头角。
乳腺密度分析主要依赖定制化 CNN,其中图卷积网络(GCN)、多视图注意力残差学习等架构在区分四类密度(BI-RADS A–D)中表现出良好潜力。然而,相关研究总量偏少,且缺乏针对亚洲人群的深入验证。

亚洲人群的特殊挑战

亚洲女性不仅乳腺癌发病高峰提前至40–50岁,且多为高密度乳腺,这给 mammography 的早期检出带来双重困难。文化习俗、经济条件及医疗资源分布不均衡进一步限制了筛查普及与数据积累。目前公开的亚洲数据集如中国 CMMD、越南 VinDr-mammo 等,普遍存在样本量有限、标注不全(尤其缺乏病灶分割与详细 BI-RADS 标注)问题,难以支撑深度学习模型的高质量训练。

数据预处理与增强策略

预处理环节常用自适应中值滤波去噪、对比度受限自适应直方图均衡化(CLAHE)增强图像、阈值法与形态学运算提取感兴趣区域(ROI)。数据增强则除常规旋转、翻转外,生成对抗网络(GAN)和扩散模型(Diffusion Model)等合成技术正逐步用于解决样本不平衡问题。然而,过度的几何变换可能引入不具临床意义的伪影,而生成图像的解剖合理性与病理真实性仍需严格评估。

未来展望

为推动深度学习在乳腺癌诊断中的精准、公平应用,未来应在三方面着力:一是构建多中心、多人群的大型标注数据集,尤其加强亚洲、非洲等地区数据收集;二是发展跨人群域自适应、联邦学习等技术,提升模型泛化能力;三是推动多视图(CC/MLO)融合、多模态(影像+临床)整合以及 BI-RADS 全类别分类的细粒度研究。同时,模型需在真实临床环境中进行广泛验证,确保其在不同人种、密度类型及设备条件下的可靠性。

结论

本系统综述表明,深度学习技术有望显著提升乳腺X线摄影的筛查效能,但当前研究存在明显的数据偏见与地理不平衡。未来必须致力于开发包容不同人群特征的模型,并通过国际合作与标准化评估,真正实现 AI 辅助诊断在全球乳腺癌防控中的普惠价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号