基于机器学习和深度学习影像组学预测乳腺癌新辅助化疗后淋巴结转移预后的模型开发与验证

【字体: 时间:2025年10月01日 来源:Breast Cancer: Targets and Therapy 3.3

编辑推荐:

  本研究开发并验证了整合临床参数、放射组学(Radiomics)和深度学习放射组学(DLR)的机器学习模型,用于预测乳腺癌新辅助化疗(NAC)后淋巴结(LN)状态及患者预后。临床-深度学习放射组学(Clinical-DLR)模型在测试集中AUC达0.911–0.921,显著优于传统模型,可实现高危/低危患者分层,为个体化治疗决策提供新工具。

Abstract
淋巴结(LN)状态是接受新辅助化疗(NAC)的乳腺癌患者的关键预后因素。本研究旨在开发和验证机器学习模型,以预测淋巴结转移乳腺癌患者的淋巴结反应。
Background
乳腺癌(BC)是全球女性中最常见的恶性肿瘤,治疗反应存在显著异质性。新辅助化疗(NAC)广泛应用于淋巴结(LN)阳性乳腺癌患者,旨在降低肿瘤分期和消除转移性淋巴结沉积。虽然30%的乳腺癌患者在新辅助化疗后达到病理完全缓解(pCR),但仍有相当一部分患者表现出耐药性,这凸显了对预测性生物标志物的需求。先前研究表明,约35–68%的腋窝淋巴结(ALN)阳性患者在新辅助化疗后可以实现腋窝pCR,从而改善预后。目前,磁共振成像(MRI)在预测新辅助化疗后残留病灶方面比临床检查、 mammography或超声更准确。尽管深度学习算法在预测个体肿瘤学结果方面已显示出有效性,但很少有研究整合多模态数据来同时预测淋巴结反应并实现患者风险的预后分层。本研究通过整合临床参数、影像组学特征和深度学习算法,填补了这一空白。
Methods
Population Selection and Study Design
本研究回顾性分析了2019年1月1日至2023年1月31日在重庆医科大学附属第一医院接受新辅助化疗的乳腺癌伴腋窝淋巴结转移患者的临床和MRI数据。研究遵循《赫尔辛基宣言》的伦理标准,并获得医院伦理委员会批准。所有患者均符合以下标准:经病理检测确诊为乳腺癌;在开始任何侵入性操作或治疗前完成MRI检查;经影像学或病理检查高度怀疑或确认存在腋窝淋巴结转移;接受了新辅助化疗;完成了治疗程序并有完整的随访记录。患者根据腋窝淋巴结对新辅助化疗的反应分为达到腋窝淋巴结pCR组和未达到组(Non-pCR)。首先,使用三种自变量组合(临床、临床-影像组学和临床-深度学习影像组学(Clinical-DLR))训练和验证机器学习模型,直接预测淋巴结pCR。然后,根据模型预测的淋巴结pCR概率阈值将患者分为高风险和低风险组。
Follow-Up
所有患者从出院至2024年3月31日通过门诊或电话进行随访。选择无病生存期(DFS)作为评估患者生存时间的指标。DFS定义为从手术到以下事件中最先发生的时间:肿瘤局部、区域或远处首次复发;诊断出继发性恶性肿瘤或对侧乳腺癌;或任何原因导致的死亡。
Construction and Validation of Machine Learning Models
整合发生在逻辑回归或随机森林模型的分步增强阶段:1)临床模型(第一步):使用选择的临床变量(如ER、HER2、T分期)构建逻辑回归模型和随机森林模型。2)临床-影像组学模型(第二步):将上述临床变量与放射组学评分(rad_score)结合,构建新的逻辑回归和随机森林模型。3)临床-DLR模型(最后一步):将临床变量、rad_score与ResNet3D50衍生的淋巴结pCR概率评分(作为连续变量)结合,构建最终模型。这些模型在按7:3分层的训练-测试集上进行评估。性能指标包括敏感性、特异性、AUC等。对于临床模型,通过相关分析和逐步逻辑回归评估临床病理变量与新辅助化疗后淋巴结状态的关系。对于临床-影像组学模型,基于选择的影像组学特征计算rad_score并纳入临床模型。对于临床-DLR模型,将深度学习模型预测的淋巴结状态概率评分纳入临床-影像组学模型。
Deep Learning Architecture
基于Darwin研究平台,使用ResNet-3D-50作为深度学习模型。该模型源自2D ResNet50架构,用于处理体积医学成像数据。架构包括3D卷积层、带有恒等跳跃连接的残差块和全局平均池化。输入体积首先通过7×7×7卷积层,然后经过四个残差阶段,空间特征通过全局平均池化聚合,最后通过softmax激活的全连接层进行分类。训练使用Adam优化器,历时30个epoch。
Statistical Analysis
使用RStudio和Darwin平台进行统计分析和数据处理。连续变量根据正态性使用Wilcoxon秩和检验、Mann–Whitney检验或t检验进行分析。分类变量使用χ2检验或Fisher精确检验进行分析。为三种自变量组合开发了随机森林和逻辑回归模型。使用AUC、准确度、敏感性、特异性、F1分数评估模型性能。使用Kaplan–Meier分析估计DFS曲线,并使用Log rank检验比较组间DFS。所有统计检验均为双尾,P<0.05认为有统计学意义。
Results
Baseline of the Clinical Characteristics
本研究最终纳入447名患者。患者中位年龄51岁。超过一半的患者接受了TEC方案的新辅助化疗。约三分之二的患者接受了6至8个周期的化疗。新辅助化疗完成后,171名患者(38.3%)乳腺组织无残留肿瘤,216名患者(48.3%)腋窝淋巴结无残留肿瘤,138名患者(30.9%)达到pCR。中位DFS为23.4个月,随访期间60名患者发生事件。患者按7:3比例分为训练集和测试集。
Comparison of Patients with or without Residual Tumor in the Axilla
与腋窝非pCR患者相比,腋窝pCR患者更可能接受更多化疗周期;激素受体阴性比例更高;更可能为HER2阳性;Ki67指数更高;T分期更低;更可能达到乳腺pCR。生存分析显示,腋窝pCR患者预后显著优于腋窝非pCR患者。
Model Construction and Validation
Clinical Models
相关分析和逐步逻辑回归确定ER状态、HER2状态和T分期与新辅助化疗后淋巴结状态显著相关。逻辑回归模型在测试集中的特异性、敏感性和AUC分别为0.574、0.789和0.738。随机森林模型在测试集中的性能分别为0.689、0.718和0.755。
Clinical-Radiomics Models
从1781个影像组学特征中筛选出6个用于分析,并与临床变量结合创建rad_score。随机森林模型在测试集中的特异性、敏感性和AUC分别为0.590、0.887和0.801。逻辑回归模型在测试集中的性能分别为0.852、0.606和0.798。
Clinical-DLR Models
将深度学习预测作为自变量开发临床-DLR模型。随机森林模型在测试集中的特异性、敏感性和AUC分别为0.803、0.930和0.923。逻辑回归模型在测试集中的性能分别为0.820、0.887和0.911。
Comparison of the Performance Among Each Model and Stratification of Patients
使用决策曲线分析评估模型性能,临床-DLR模型始终优于其他模型。根据模型预测将患者分为高风险和低风险组,Kaplan–Meier分析显示预后存在显著差异。
Discussion
本研究调查了乳腺癌伴腋窝淋巴结转移患者新辅助化疗后的腋窝反应模式。研究发现 achieving pCR in the ALN strongly correlated with breast pCR。 critically, patients with LN pCR exhibited significantly improved DFS compared to those with non-pCR counterparts, underscoring the prognostic value of LN response assessment。开发了三种预测框架:临床、临床-影像组学和临床-DLR。选择逻辑回归和随机森林两种算法进行堆叠泛化。结果证实,整合影像组学特征(尤其是基于深度学习的)显著提高了预测准确性。临床-DLR模型实现了 superior performance,表明机器学习驱动的淋巴结反应评估提高了预后准确性。
多年来,早期预测淋巴结pCR的能力具有重要的临床意义,因为它有助于通过升级或降级调整个性化、基于证据的治疗。先前研究强调了MRI提供定量生物标志物以有效预测乳腺癌患者pCR的潜力。有研究表明,结合临床因素的影像组学列线图在评估淋巴结阳性乳腺癌患者对新辅助化疗的反应方面表现出 promising predictive efficacy。另有研究利用应用于超声检查的DLR来预测新辅助化疗后的肿瘤反应和淋巴结状态。类似地,有研究开发了基于MRI的深度学习特征来预测乳腺癌患者新辅助化疗后的腋窝反应。然而,先前研究存在 critical gaps:未能验证预后结果,且传统方法 often overlook deep learning architectures that could optimize outcome prediction through multimodal data integration。
本研究强调了几个 critical considerations。首先,确定了6个影像组学特征,这些特征可能与患者的临床表现和生存结果存在潜在关联。在临床-影像组学模型开发过程中,直接整合影像组学特征 initially provoked severe model overfitting, necessitating adoption of a conventional Rad-score framework。虽然Rad-scores提高了可重复性,但其对降维的依赖 risks obscuring biologically meaningful tumor heterogeneity encoded in radiomics data。
其次,由于乳腺肿瘤的独特性,T2加权成像等序列经常表现出与周围正常腺体组织融合的模糊肿瘤边界。这种模糊性给靶区勾画带来了 substantial difficulties。文献综述证实,目前没有广泛接受的临床指南或金标准来解决这个问题。因此,仅使用了T1-DCE序列。此外,仅整合rad_score未能 confer added predictive benefit,而过度整合特征 compromised generalizability by inducing overfitting。
第三,随机森林算法在处理高维影像组学数据时表现出 heightened susceptibility to overfitting,表明基于树的模型对于此类任务可能 suboptimal。建议使用逻辑回归或支持向量机(SVM)以平衡可解释性和鲁棒性。
据我们所知,本研究证实,来自淋巴结转移乳腺癌患者的DCE-MRI图像含有与预后相关的数据,能够有效预测临床结果。深度学习算法,特别是在应用于这些数据集时,显示出 decode complex prognostic biomarkers 的 significant potential。值得注意的是,虽然这项工作仅关注T1加权DCE-MRI,但它建立了一个框架,用于指导晚期乳腺癌的早期治疗干预。该模型有潜力帮助临床医生优化患者治疗过程,实现更个性化的手术和放疗路径。具体来说,它可以 facilitate axillary surgery de-escalation, radiation therapy optimization, and systemic therapy de-escalation。最终,无创淋巴结pCR预测为风险适应的腋窝管理提供了一个工具,超越了目前对侵入性淋巴结分期和仅通过手术评估反应的依赖。值得注意的是,Grad-CAM可视化表明,瘤周区域值得重点关注。
然而,存在几个局限性。首先,这是一项单中心研究,可能在患者选择和成像协议方面存在潜在偏倚。其次,仅依赖T1-DCE序列排除了互补的多参数MRI数据整合,这 likely contributes to the suboptimal discriminative performance of the Clinical-Radiomics model。第三,这些模型衍生的风险组与长期生存结果之间的关联是在分析阶段进行的间接评估。最关键的是,回顾性设计需要在前瞻性临床研究中得到验证。
尽管在模型开发过程中进行了5折交叉验证以评估内部泛化能力。逻辑回归模型表现出稳健的判别性能,在验证队列中的AUC值分别为0.955、0.913、0.907、0.907和0.915。随机森林模型在验证队列中的AUC值分别为0.952、0.932、0.938、0.911和0.874。未来的研究应与多中心试验合作,前瞻性地测试我们的模型。或者利用具有兼容临床/成像变量的公共数据集进行基准测试。此外,肿瘤异质性分析可以与多组学框架整合——包括病理组学、转录组学和基因组学——以阐明驱动转移和治疗抵抗的空间分辨生物学机制。我们还主张整合深度学习架构,优先进行算法不可知论比较以确定最佳特征融合策略。最后,必须严格检查深度学习衍生特征在异质队列中的稳定性,并进行可重复性评估,以弥合计算输出与临床可操作见解之间的差距。
总之,虽然传统影像组学和单独的临床变量表现出有限的预测效用,但整合基于MRI的深度学习算法、影像组学特征和临床病理风险因素产生了一个 robust model for forecasting axillary LN response to NAC。提出的临床-DLR框架在区分淋巴结反应者和无反应者方面实现了 superior discriminative accuracy。这不仅增强了预后精确性,而且能够实现动态风险分层,从而识别出可能受益于早期治疗升级或适应性治疗方案的高危患者。
Ethics Approval and Consent to Participate
本研究遵循《赫尔辛基宣言》的伦理标准,并获得重庆医科大学附属第一医院伦理委员会批准。由于研究的回顾性性质和使用去标识化患者数据,伦理委员会放弃了知情同意。
Author Contributions
所有作者对报告的工作做出了重大贡献,无论是在构思、研究设计、执行、数据获取、分析和解释方面,还是在所有

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号