基于乳腺X线深度学习特征与SHAP值整合的机器学习模型预测乳腺导管原位癌保乳术后5年复发风险

【字体: 时间:2025年09月16日 来源:Frontiers in Immunology 5.9

编辑推荐:

  本研究创新性地将乳腺X线深度学习特征与临床病理指标整合,通过16种机器学习算法构建梯度提升机(GBM)预测模型(AUC=0.918),结合SHAP值解释技术揭示乳腺影像特征(MS)、Ki-67指数和组织学分级是关键预测因子,为DCIS患者术后个性化管理提供可解释的决策工具。

  

背景

乳腺导管原位癌(DCIS)占新发乳腺癌的20%-25%,保乳手术(BCS)后仍有进展为浸润性乳腺癌(IBC)的风险。传统预测方法主要依赖临床病理因素,忽视了乳腺X线影像的潜在价值。本研究旨在开发整合影像组学特征与临床指标的机器学习模型,并利用SHAP值解释关键预测因子。

方法

回顾性分析哈尔滨医科大学附属肿瘤医院2011-2020年140例DCIS患者数据,随访至2025年。采用pyradiomics提取术前数字化乳腺X线特征,经资深放射科医师审核。通过10折交叉验证的LASSO回归筛选特征,数据集按10:4分为训练集(n=100)和验证集(n=40)。比较16种机器学习算法性能,使用ROC曲线、敏感性、特异性等指标评估,结合SHAP值和决策曲线分析(DCA)验证临床实用性。

结果

梯度提升机(GBM)表现最优,测试集AUC达0.918(95%CI 0.873-0.963)。SHAP分析显示乳腺影像特征(MS)是最重要预测指标,其次为Ki-67指数和组织学分级。未接受放疗患者复发率显著较高。关键预测因子包括:MS(含原始图像10百分位数、灰度共生矩阵对比度等5个特征)、Ki-67>30%、高级别组织学分级和化疗缺失。

讨论

相比传统临床评分系统(如VNPI),本模型创新性整合了深度学习衍生的影像特征:MS高分对应簇状微钙化或鼠尾状模糊肿块等影像表现。SHAP力图示例如显示,高级别病灶可使基线复发风险(0.243)降低至0.144。尽管辅助放疗可降低50%-70%复发风险,但模型识别出特定高风险亚组(高MS+高Ki-67+高级别)可能需要强化治疗。

局限性

单中心回顾性研究存在选择偏倚,亚洲人群数据限制外部有效性。影像特征仅基于二维乳腺X线,未纳入动态增强MRI等多模态数据。部分治疗细节(如放疗剂量分割方案)数据不完整可能影响结果。

结论

本研究建立的GBM模型通过可解释的SHAP分析,证实乳腺X线特征联合Ki-67和组织学分级可精准预测DCIS复发风险,为临床提供兼具高准确性(AUC>0.9)和透明度的决策支持工具。未来需在前瞻性多中心队列中验证模型的普适性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号