基于深度学习卷积神经网络的乳腺钼靶图像评估乳腺癌 HER2、ER 和 PR 表达

【字体: 时间:2025年02月10日 来源:Scientific Reports 3.8

编辑推荐:

  乳腺癌严重威胁女性健康,HER2、ER 和 PR 表达对治疗策略制定至关重要。研究人员开发深度学习模型(CBAM ResNet-18)预测其表达。该模型性能良好,有望成为乳腺癌辅助诊断工具。

  在女性健康领域,乳腺癌就像一颗 “定时炸弹”,严重威胁着全球女性的生命安全。据国际癌症研究机构(IARC)数据,2020 年全球新增癌症病例达 1929 万,其中乳腺癌新发病例飙升至 226 万,一举超越肺癌,成为全球发病率最高的癌症,占所有新增癌症病例的 11.7% 。
早期发现乳腺癌对于提高患者生存率意义重大,而钼靶检查是乳腺癌筛查的重要影像学手段。不仅如此,明确乳腺癌患者人表皮生长因子受体 2(HER2)、雌激素受体(ER)和孕激素受体(PR)的表达状态,对制定精准治疗策略起着关键作用。例如,HER2基因扩增的患者可使用曲妥珠单抗等靶向治疗药物;ER 和 PR 阳性的患者,使用他莫昔芬等激素受体靶向药物能显著提升生存几率。

然而,过往研究存在诸多难题。一方面,利用深度学习预测 HER2、ER 和 PR 状态的相关研究较少,且已有成果不尽人意。像 Ueda 等人用深度学习模型对乳腺癌受体表达分类,ER、PR 和 HER2检测数据集的 AUC 值分别仅为 0.67、0.61 和 0.75。另一方面,以往研究多需手动分割钼靶图像中的可疑肿块,不仅耗时费力,还可能产生偏差。

为了突破这些困境,深圳大学总医院(Department of General Surgery, Institute of Precision Diagnosis and Treatment of Digestive System Tumors and Guangdong Provincial Key Laboratory of Chinese Medicine Ingredients and Gut Microbiomics, Shenzhen University General Hospital, Shenzhen University, Shenzhen, China)等多机构的研究人员展开了深入探索。他们旨在开发一种无需手动分割肿块,就能基于钼靶图像预测 HER2、ER 和 PR 表达的深度学习模型,从而为乳腺癌治疗方案的制定提供更有效的辅助诊断依据。最终,研究成果发表在《Scientific Reports》上。

研究人员采用了多种关键技术方法:

  • 数据收集:从华中科技大学协和深圳医院和山东大学第二医院收集患者数据,构建训练数据集和独立测试数据集。训练数据集涵盖 2018 年 1 月至 2021 年 11 月 237 例乳腺癌患者的数字成像和医学通信(DICOM)数据,测试数据集包含 2020 年 1 月至 2022 年 5 月 155 例患者的 DICOM 数据1
  • 模型构建:以 ResNet-18 为基础架构,嵌入卷积块注意力模块(CBAM)构建 CBAM ResNet-18 模型。同时开发无注意力模块的原始 ResNet-18 和有、无 CBAM 的 VGG-19 模型作对照。
  • 模型训练与评估:在训练数据集上进行五折交叉验证训练模型,使用二元交叉熵损失函数和 Adam 优化器,并采用随机裁剪、添加随机椒盐噪声等数据增强方法及早停策略防止过拟合。用受试者工作特征曲线下面积(AUC)、特异性、准确性、精度、召回率和 F1 分数等指标评估模型性能2

下面来看具体的研究结果:

  • 患者群体和病变特征:详细介绍了训练数据集和测试数据集的患者基本人口统计学和临床病理特征,如年龄、肿瘤位置、分级、HER2、ER、PR 状态等,为后续模型分析提供基础36
  • 深度学习分析:在训练阶段,HER2、ER 和 PR 的五折交叉验证平均 AUC 值分别为 0.752、0.733 和 0.756。测试阶段,HER2测试数据集的 AUC(95% CI)为 0.708(0.609, 0.808),ER 为 0.785(0.673, 0.897),PR 为 0.706(0.603, 0.809)。CBAM ResNet-18 模型在预测 ER 状态时表现尤为突出,准确性达 0.845,F1 分数为 0.905459
  • 模型比较:与原始 ResNet-18 无注意力模块和 VGG-19 有、无注意力模块相比,CBAM ResNet-18 模型性能更优。例如,在 HER2预测中,原始 ResNet-18 的 AUC(95% CI)仅为 0.603(0.484, 0.707),而 CBAM ResNet-18 为 0.708(0.609, 0.808)7810

研究结论和讨论部分指出,本研究构建的卷积神经网络(CNN)模型,能基于钼靶图像有效估计 HER2、ER 和 PR 的表达。这为乳腺癌治疗前评估肿瘤生物学特性提供了一种无创且经济高效的方法。不过研究也存在局限性,如未分析同一乳房存在多种分子亚型病变的情况,样本量相对较小等。但总体而言,该研究成果为乳腺癌的诊断和治疗开辟了新方向,未来结合更多临床数据,有望进一步提升模型准确性,为乳腺癌患者带来更多希望。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号