
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的乳腺癌新辅助治疗后病理完全缓解预测模型构建与验证
【字体: 大 中 小 】 时间:2025年05月24日 来源:BMC Cancer 3.4
编辑推荐:
本研究针对乳腺癌新辅助治疗(NAT)后病理完全缓解(pCR)预测的临床难题,通过分析1143例患者的临床病理数据,采用7种机器学习算法构建预测模型。研究发现分子亚型、诊断至治疗间隔等4个关键变量,其中朴素贝叶斯(Naive Bayes)模型表现最优(准确率74.6%,AUC 75.1%),并开发了临床决策工具,为个体化治疗提供新策略。
乳腺癌作为女性最高发的恶性肿瘤,全球每年新增病例超200万。新辅助治疗(NAT)已成为局部晚期乳腺癌的标准疗法,其核心目标是实现病理完全缓解(pCR)——这一指标被FDA认可为替代终点,与患者长期生存显著相关。然而临床实践中,pCR率仅30-40%,且传统预测方法存在精度不足、依赖术后评估等局限。如何通过治疗前指标精准预测pCR,从而优化治疗方案选择,成为亟待解决的临床难题。
南昌医学院第二附属医院乳腺外科团队联合南昌市人民医院病理科,在《BMC Cancer》发表了一项突破性研究。该研究创新性地应用机器学习技术,通过分析1143例乳腺癌患者的临床病理数据(包括分子亚型、T/N分期等10个变量),开发了首个基于朴素贝叶斯算法的pCR预测模型。研究采用多中心回顾性队列设计,训练集来自南昌市人民医院(NPH队列,n=909),外部验证集来自江西省肿瘤医院(JCH队列,n=234)。关键技术包括LASSO回归特征筛选、7种机器学习算法比较(逻辑回归/KNN/SVM等)、SHAP可解释性分析,并开发了临床应用的网页工具。
研究结果
关键变量筛选
通过LASSO回归从10个候选变量中锁定4个核心预测因子:组织学分级(grade)、淋巴结分期(N stage)、诊断至治疗间隔(months)、分子亚型(subtype)。其中HER2阳性(HR-/HER2+)和三阴性(HR-/HER2-)亚型对pCR贡献度最高(SHAP均值0.32)。
模型性能验证
在验证集中,朴素贝叶斯模型展现出最优综合性能:
这项研究开创了机器学习在乳腺癌新辅助疗效预测中的临床应用范式。其核心价值在于:
局限性包括回顾性设计、未纳入治疗方案差异等。未来可通过整合多组学数据、前瞻性验证进一步提升模型精度。该成果为实现乳腺癌"精准新辅助"治疗迈出关键一步,相关方法学框架也可拓展至其他癌种疗效预测领域。
生物通微信公众号
知名企业招聘