基于栖息地成像和视觉变换器的机器学习在预测局部晚期食管鳞状细胞癌新辅助化疗免疫治疗后治疗反应中的应用:一项多中心研究
《Frontiers in Immunology》:Application of machine learning based on habitat imaging and vision transformer to predict treatment response of locally advanced esophageal squamous cell carcinoma following neoadjuvant chemoimmunotherapy: a multi-center study
【字体:
大
中
小
】
时间:2025年08月07日
来源:Frontiers in Immunology 5.9
编辑推荐:
食管鳞癌化疗免疫治疗疗效预测模型研究:通过栖息地成像和Vision Transformer提取肿瘤亚区域影像特征,结合LASSO特征选择和 ExtraTrees模型构建,实现高精度(AUC 0.917)和跨中心验证(AUC 0.831)的疗效预测,支持个性化治疗决策。
本研究聚焦于如何更准确地评估局部晚期食管鳞状细胞癌(ESCC)患者在接受新辅助免疫化疗(nICT)后的治疗反应。当前,医学检查和生物标志物在评估nICT疗效方面存在局限,因此开发一种基于机器学习和深度学习的非侵入性方法显得尤为重要。研究团队利用栖息地成像技术,结合深度学习模型,构建了一个能够预测患者对nICT反应的机器学习模型,其核心在于分析肿瘤内部的异质性,从而提高预测的准确性。
研究收集了来自六个医学中心的309例ESCC患者数据,将患者分为训练队列和外部验证队列。在栖息地成像分析中,研究团队通过K-means聚类方法对肿瘤内部的亚区进行分类。具体而言,利用19种来自CT影像的特征(如熵值等)对肿瘤进行分割,并通过Calinski-Harabasz指数(CH指数)确定最优的聚类数量。结果显示,K=2时CH指数达到最大值,因此将肿瘤分为两个异质性亚区:栖息地1(H1)和栖息地2(H2)。此外,还通过自动膨胀技术生成肿瘤周围的亚区(即“周围肿瘤亚区”),以便更全面地评估肿瘤特征。
在深度学习模型构建过程中,研究团队采用Vision Transformer(ViT)架构作为主干网络,对三个亚区(肿瘤内部、周围肿瘤区域和背景区域)分别进行特征提取。为了提高模型的泛化能力,研究团队对输入图像进行了标准化处理,包括调整像素强度、统一图像分辨率(1 mm × 1 mm × 1 mm)等。通过数据增强技术(如水平翻转、垂直翻转和随机裁剪)进一步优化模型训练效果。在训练过程中,网络参数通过前向传播和反向传播进行更新,优化过程采用Adam优化器和交叉熵损失函数,并结合余弦退火技术动态调整学习率。
深度学习特征的融合与筛选是模型构建的关键环节。研究团队首先采用特征级融合策略,即将三个亚区提取的深度学习特征合并为一个特征向量。随后,通过Z-score标准化处理,确保特征在不同亚区间的可比性。为了筛选出最具预测能力的特征,研究团队采用LASSO回归分析,剔除高度相关的冗余特征,并保留对治疗反应预测具有显著影响的特征。最终,18个深度学习特征被选中用于后续的机器学习模型构建。
在机器学习模型的构建与评估中,研究团队尝试了11种不同的算法,包括逻辑回归(LR)、支持向量机(SVM)、随机森林(RF)、梯度提升树(GradientBoosting)、ExtraTrees、AdaBoost、LightGBM、朴素贝叶斯(NaiveBayes)、XGBoost、多层感知机(MLP)和K近邻(KNN)。模型的性能评估采用多种指标,包括曲线下面积(AUC)、决策曲线分析(DCA)、校准曲线和准确率。其中,ExtraTrees模型在训练队列和外部验证队列中均表现出最佳的预测性能,其AUC值分别为0.917和0.831。此外,在接受两轮nICT的患者中,ExtraTrees模型的AUC值为0.862,显示出良好的临床适用性。
为了进一步验证模型的临床价值,研究团队进行了决策曲线分析(DCA),评估了ExtraTrees模型在不同阈值概率范围内的净收益。结果表明,该模型在合理阈值范围内(0.2-0.8)表现出较高的净收益,这说明其在预测治疗反应方面具有重要的临床意义。同时,校准曲线也显示,模型预测的病理完全反应(pCR)和主要病理反应(MPR)的概率与实际观察结果之间存在良好的一致性,进一步增强了模型的可信度。
在子群体分析中,研究团队探讨了ExtraTrees模型在不同nICT轮次患者中的表现。结果显示,模型在两轮nICT的患者中具有较高的预测能力,而在其他轮次的患者中,由于样本量较小,模型的性能略有下降。这提示研究团队未来需要扩大样本量,尤其是从更多医学中心获取数据,以增强模型的稳健性和代表性。
为了更直观地理解模型的预测机制,研究团队采用SHapley Additive exPlanations(SHAP)方法对模型的输出进行可视化分析。SHAP值能够清晰地展示每个特征对预测结果的贡献程度,帮助研究人员识别哪些特征在模型中具有更高的权重。通过分析不同患者的SHAP图,可以更深入地了解模型在预测治疗反应时的决策逻辑,为临床应用提供理论支持。
研究团队还指出,当前用于评估nICT疗效的常规方法,如CT和内镜超声(EUS),在面对治疗相关的炎症、水肿和纤维化等变化时,往往难以准确反映肿瘤的真实状态。此外,免疫治疗的延迟反应、假性进展和过度进展等机制也使得传统影像学方法在评估疗效时存在局限。相比之下,栖息地成像技术能够更细致地分析肿瘤内部的异质性,为预测治疗反应提供更丰富的信息。而深度学习模型则能够自动提取图像中的数字特征,避免了人工特征选择的主观性,从而提高了预测的准确性。
在讨论部分,研究团队指出,尽管筛查和治疗方案不断进步,但局部晚期ESCC患者的5年生存率仍然较低,主要归因于肿瘤的异质性和药物耐受性。因此,提前预测治疗反应并识别可能受益的患者群体,对于减少不必要的免疫相关不良事件(irAEs)和优化治疗方案具有重要意义。MPR和pCR是目前评估nICT疗效的主要指标,其中达到pCR的患者可能不需要手术或进一步治疗,而达到MPR的患者则表明其对nICT具有良好的敏感性。然而,对于未达到pCR的患者,是否意味着治疗无效仍需进一步评估,因为部分患者仍可能实现MPR。
此外,研究团队还提到,除了CT和EUS等常规影像学检查外,PD-L1表达水平和肿瘤突变负荷(TMB)等生物标志物也被用于评估免疫治疗的适用性。然而,PD-L1在预测nICT疗效方面存在争议,某些研究发现,无论PD-L1表达水平如何,免疫治疗与化疗联合使用均能为ESCC患者带来临床获益。同样,TMB作为预测免疫治疗反应的指标,也存在一定的不确定性。由于这些生物标志物通常需要从肿瘤组织中提取,其获取过程不仅繁琐,而且可能受到肿瘤异质性的影响,难以全面反映肿瘤的整体特征。
本研究通过结合栖息地成像和深度学习技术,构建了一个非侵入性的预测模型,能够更全面地捕捉肿瘤的特征。相比于传统的影像学方法,该模型在多个方面具有显著优势。首先,它能够识别肿瘤内部的不同亚区,从而更精确地反映肿瘤的异质性。其次,深度学习模型能够自动提取图像特征,避免了人工选择特征的局限性。最后,ViT模型的自注意力机制使得其在处理非相邻图像元素时表现出更强的泛化能力,相比传统的卷积神经网络(CNNs)具有更高的预测精度。
尽管本研究取得了一定成果,但也存在一些局限性。首先,研究设计为回顾性研究,虽然通过严格的患者筛选减少了选择偏倚,但仍可能影响结果的可靠性。其次,尽管研究团队尽力统一影像数据,但由于不同医学中心使用的CT设备和扫描协议存在差异,影像数据的异质性仍然不可避免,这可能影响模型的泛化能力。此外,研究仅针对ESCC患者,未涉及食管腺癌(EAC)等其他类型,因此其适用范围可能受到一定限制。最后,由于研究为回顾性设计,相关数据用于探索治疗反应预测的生物学机制较为有限,未来研究需要结合多组学方法,进一步揭示深度学习特征与肿瘤生物学特性之间的关系。
总的来说,本研究通过整合栖息地成像和深度学习技术,构建了一个具有较高预测性能的机器学习模型,能够有效评估ESCC患者在接受nICT后的治疗反应。该模型不仅提高了预测的准确性,还为临床决策提供了重要参考,有助于减少不必要的治疗和避免免疫相关不良事件的发生。未来的研究将进一步扩大样本量,增强模型的适用性和稳定性,并探索其在其他肿瘤类型中的推广价值。同时,结合多组学数据和更先进的深度学习方法,有望进一步提升模型的预测能力,为个体化治疗提供更坚实的科学依据。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号