基于人工智能算法预测乳腺癌术后患者一年复发的回顾性研究:预后因素分析

【字体: 时间:2025年05月27日 来源:BMC Cancer 3.4

编辑推荐:

  为解决乳腺癌术后患者复发率高、预后预测需求,研究人员开展基于 AI 算法预测术后 1 年复发的研究。利用 1156 例数据,对比多种算法,发现随机森林(RF)性能最佳,SHAP 分析显示肿瘤分级等是关键因素,为临床决策提供新工具。

  乳腺癌作为全球女性高发恶性肿瘤,尽管五年生存率较高,但术后复发风险不容忽视(约 20-30%),精准预测复发对优化治疗、延长生存至关重要。传统临床评估依赖医生经验,耗时长且准确性有限,而人工智能(AI)在挖掘多维度数据关联方面展现潜力。在此背景下,伊朗德黑兰医科大学(Tehran University of Medical Sciences)的研究人员开展了一项针对乳腺癌术后患者一年复发预测的研究,相关成果发表于《BMC Cancer》。
研究团队收集了德黑兰 3 家临床中心 2020 年 1 月 30 日至 2022 年 12 月 30 日期间的 1156 例乳腺癌术后患者数据,包含 23 项预后因素,如年龄、肿瘤分级、人类表皮生长因子受体 2(HER-2+)、淋巴结转移数目等。通过数据预处理(去除重复值、处理缺失值)、合成少数类过采样技术(SMOTE)平衡样本后,采用单变量分析(卡方检验、eta 系数)、逻辑回归筛选关键特征,并运用 7 种机器学习(ML)和深度学习(DL)算法构建预测模型,包括随机森林(RF)、极端梯度提升(XGB)、支持向量机(SVM)、卷积神经网络(CNN)等。研究通过十折交叉验证、受试者工作特征曲线(ROC-AUC)、校准曲线、决策曲线分析(DCA)等评估模型性能,并利用 SHapley 加性解释(SHAP)分析关键预后因素。

研究结果


  1. 模型性能对比:随机森林(RF)在多项指标中表现最优,阳性预测值(PPV)0.96、阴性预测值(NPV)0.92、灵敏度 0.92、特异度 0.96、准确率 0.94,ROC-AUC 达 0.919,显著优于其他算法(如 CNN 的 ROC-AUC 为 0.833)。在保留法验证中,RF 在训练集和测试集均保持高准确性,且过拟合风险低。
  2. 关键预后因素:SHAP 分析显示,肿瘤分级、HER-2 状态、淋巴结转移数目是预测一年复发的最重要因素。高肿瘤分级、HER-2 阳性、淋巴结转移数目多均与复发风险显著正相关。
  3. 临床 utility 评估:决策曲线分析(DCA)表明,RF 模型在广泛的风险阈值范围内净获益(NB)高于其他模型,提示其在临床决策中的实用价值。

结论与讨论


本研究证实随机森林算法在乳腺癌术后一年复发预测中的卓越性能,其整合多维度临床数据的能力为早期识别高风险患者提供了可靠工具。关键预后因素的识别(如 HER-2、肿瘤分级)与现有临床认知一致,进一步验证了模型的合理性。该研究为 AI 在肿瘤预后领域的应用提供了新证据,有望辅助临床制定个性化随访和治疗方案,优化医疗资源分配。尽管研究存在样本来源局限、未与传统预后工具(如 Oncotype DX)对比等不足,但其方法学为后续多中心、大样本研究奠定了基础。未来可进一步拓展模型适用性,推动 AI 在乳腺癌全程管理中的普及。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号