基于深度学习的新方法:结合多模态MRI、诺模图(nomogram)和决策曲线分析预测乳腺癌中的HER2表达

《Frontiers in Oncology》:Novel deep learning-based prediction of HER2 expression in breast cancer using multimodal MRI, nomogram, and decision curve analysis

【字体: 时间:2025年10月30日 来源:Frontiers in Oncology 3.3

编辑推荐:

  HER2表达预测研究开发整合多序列MRI深度学习特征与临床数据的自动化框架,通过4种模型提取T1、T2、DCE序列特征,经ICC≥0.9和LASSO筛选保留关键影像特征(如洗脱增强、水肿)及临床变量,构建nomogram模型AUC达0.94,显著优于传统方法,验证影像特征与分子表型的关联性,为精准治疗提供可靠工具。

  本研究致力于开发一种稳健且自动化的框架,用于通过整合多序列乳腺磁共振成像(MRI)与基于深度学习的特征提取及临床数据,预测乳腺癌中的HER2表达情况。HER2(人类表皮生长因子受体2)的表达水平对乳腺癌患者的预后和治疗策略具有重要影响。HER2阳性乳腺癌占所有乳腺癌病例的约15%-20%,其特征是ERBB2基因的扩增,通常表现出更具侵略性的肿瘤行为和较差的预后。因此,准确判断HER2表达对于指导靶向治疗至关重要。传统的HER2评估方法,如免疫组化(IHC)和荧光原位杂交(FISH),不仅耗时费力,还容易受到不同观察者之间的主观差异影响,这使得更加客观和自动化的评估方法成为迫切需求。

深度学习作为一种强大的工具,正在医学影像领域迅速发展,能够从放射影像中提取高维、具有区分性的特征。与传统的影像组学方法相比,深度学习模型能够自主学习层次化的特征表示,从而提升分类性能。本研究中,我们采用了四种先进的深度学习架构:ResNet50、VGG16、EfficientNet-B0和Vision Transformer(ViT-Small),以从多序列乳腺MRI中提取特征。这些模型各自具有独特的优势:ResNet50通过残差学习有效捕捉复杂的空间特征;VGG16提供结构化的特征层次;EfficientNet-B0在保持高准确率的同时优化计算效率;而Vision Transformer则利用自注意力机制实现更优的特征编码。这些深度学习提取的特征为区分HER2表达水平提供了坚实的依据。

为了提高临床可解释性和决策支持,我们构建了一个结合深度学习特征与统计学上显著的临床变量的nomogram(列线图)。列线图是一种用户友好的预测模型的图形表示,有助于进行个体化风险评估。此外,我们还进行了决策曲线分析(DCA),以评估所开发模型在不同概率阈值下的净临床效益,确保其在临床实践中的适用性。同时,我们采用受试者工作特征(ROC)分析来评估模型的性能,其中曲线下面积(AUC)作为衡量模型区分能力的关键指标。这种全面的方法不仅连接了计算建模与实际临床应用,还推动了精准医学的发展。

为了确保预测模型的稳健性和广泛适用性,我们使用了来自四个医学中心的6,438名乳腺癌患者的多中心数据集,时间跨度为2006年至2024年。这些数据涵盖了完整的影像学和分子数据,保证了模型训练和验证的多样性。多中心研究有助于减少单一机构数据集可能带来的偏差,提高模型的外部效度和广泛适用性。通过结合不同的影像协议、遗传背景和临床特征,本研究的发现更具现实意义,从而增强了所提出方法的可靠性。

在影像学数据处理方面,我们进行了标准化的预处理步骤,包括强度归一化、配准和运动校正,以确保不同中心数据的一致性和可比性。随后,我们对MRI图像进行了分割,由两位具有丰富乳腺影像经验的放射科医生独立进行,以确保精确的肿瘤区域识别。分割结果之间的差异通过共识审查加以解决,以减少观察者间的差异。为了评估预处理的有效性,我们比较了分割前后的体素强度直方图和特征再现性指标,发现强度归一化和重采样显著减少了扫描仪间的差异。

深度学习特征提取是本研究的关键步骤之一。我们采用的四种模型(ResNet50、VGG16、EfficientNet-B0和ViT-Small)在不同MRI序列(T1加权、T2加权和增强T2序列)中提取了不同数量的高维特征。例如,ResNet50在每个序列中提取了2048个特征,而VGG16则提供了更高的特征维度,达到4096个。EfficientNet-B0在保持高精度的同时优化了计算效率,提供了1280个特征,而ViT-Small则采用了自注意力机制,提取了384个特征。通过使用Intraclass Correlation Coefficient(ICC)分析,我们筛选出ICC≥0.9的高再现性特征,以提高模型的稳定性。随后,我们采用LASSO回归进行特征降维,以消除冗余特征并保留最具预测价值的特征。LASSO回归是一种通过L1正则化减少共线性并保留最相关特征的方法。在这一过程中,我们保留了56个最终特征,其中包括与HER2驱动肿瘤生物学相关的特征,如洗脱增强动力学、肿瘤周围水肿、不规则肿瘤边缘和微钙化等。这些特征不仅优化了预测性能,还与已知的生物机制相一致,进一步提升了模型的可解释性。

临床特征的选择和整合同样至关重要。我们对临床数据进行了统计分析,识别出与HER2状态显著相关的三个临床特征。这些特征被纳入回归模型中,与深度学习提取的影像学特征结合,以生成一个综合的预测模型。通过这种方式,我们计算了每个患者的Deep Score,表示其HER2阳性或阴性的可能性。这种结合不仅提高了HER2分类的准确性,还增强了模型的临床适用性。

为了构建和验证列线图,我们采用了多变量逻辑回归模型,其中每个预测因素被赋予一个加权分数。列线图直观地展示了这些预测因素与HER2阳性概率之间的关系,使临床医生能够轻松评估个体患者的HER2阳性风险。为了评估列线图的可靠性,我们进行了校准分析和内部验证。校准曲线比较了预测HER2阳性概率与实际观察结果,以衡量模型的预测准确性。通过1000次Bootstrap重采样,我们进一步减少了过拟合的风险,并评估了模型的泛化能力。Hosmer-Lemeshow拟合优度检验进一步确认了模型的拟合效果,表明预测概率与实际结果之间的一致性较高。

模型性能的评估通过ROC分析和DCA进行。ROC曲线展示了模型在区分HER2阳性与阴性病例方面的表现,而AUC值作为主要评估指标,反映了模型的区分能力。在整合所有MRI序列和临床数据后,模型的AUC达到了0.94,显著优于传统方法。DCA则评估了模型在不同概率阈值下的净临床效益,表明该模型在临床决策中具有较高的实用价值。通过比较不同模型的DCA曲线,我们发现集成模型在多个阈值下提供了最高的净效益,这表明其在临床应用中的优势。

尽管本研究取得了显著成果,但其仍存在一些局限性。目前,模型尚未在独立的队列中进行外部验证,这限制了其在更广泛临床实践中的适用性。未来的工作将集中在外部多中心数据集和前瞻性研究上,以进一步验证模型的临床实用性。此外,尽管我们采取了多种措施(如多中心招募、ICC过滤、LASSO回归和Bootstrap验证)来减少偏差,但外部验证仍然是确认模型广泛适用性的关键步骤。

本研究的结果表明,将深度学习与多序列乳腺MRI和临床数据相结合,能够有效提升HER2表达的预测能力。与现有研究相比,我们的方法在多个方面具有优势,包括更高的AUC值和更强的模型稳定性。此外,通过结合不同类型的影像数据和临床特征,我们为HER2分类提供了更丰富的特征集,从而增强了模型的准确性和可解释性。这些发现为乳腺癌的精准医学提供了新的视角,有助于优化治疗方案和改善患者预后。未来,随着更多外部数据的获取和验证,这一框架有望在临床实践中得到更广泛的应用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号