基于可解释机器学习的乳腺癌急性放射性皮炎预测模型:开发与验证研究

《Frontiers in Oncology》:Development and validation of an interpretable machine learning model for acute radiation dermatitis in breast cancer

【字体: 时间:2025年10月18日 来源:Frontiers in Oncology 3.3

编辑推荐:

  本综述开发并验证了一种可解释机器学习模型,用于预测乳腺癌放疗后急性放射性皮炎(RD)。研究整合临床、治疗及社会经济等多维变量,通过随机森林(RF)算法构建预测工具,曲线下面积(AUC)达0.84(训练集)和0.75(测试集)。SHAP分析揭示放疗靶区(CTVsc/CTVim)、TNM分期Ⅱ期和糖尿病状态为关键预测因子,模型具备优异校准性和临床效用(DCA显示净收益提升0.2–0.4),为个性化放疗方案制定提供理论依据。

  
研究背景与目的
放射性皮炎(RD)是乳腺癌放疗常见的不良反应,严重影响患者生活质量并增加医疗负担。超过半数患者会出现2级及以上皮炎,可能导致治疗中断。尽管已有研究尝试通过放射组学或多组学模型预测RD,但存在模型泛化性不足、对非线性关系拟合能力有限等问题。本研究旨在开发一种整合多维临床变量、具备可解释性的机器学习模型,以实现对高风险患者的早期识别。
研究方法与设计
本研究回顾性纳入2024年2月1日至12月19日期间691例接受术后放疗的乳腺癌患者,随访至2025年2月25日。所有患者均接受图像引导调强放疗(IGRT-IMRT),靶区勾画遵循放射治疗肿瘤学组(RTOG)指南。研究收集了31项预测变量,包括13项临床因素(如年龄、BMI、糖尿病状态)、2项社会经济因素和6项放疗参数(如临床靶区体积)。RD严重程度按RTOG急性放射毒性标准每周评估,主要终点定义为放疗期间及结束后两周内的峰值皮炎等级(≥2级视为严重RD)。数据集按8:2比例随机分为训练集(n=552)和测试集(n=139),采用10折交叉验证评估14种机器学习算法性能。
模型构建与性能验证
随机森林(RF)模型在综合评估中表现最优,训练集AUC为0.84(95% CI: 0.807–0.873),测试集AUC为0.748(95% CI: 0.665–0.831),灵敏度分别为0.811和0.877,特异性为0.747和0.576。校准曲线显示预测概率与观察风险一致性良好,训练集和测试集的Brier分数分别为0.173和0.198。决策曲线分析(DCA)表明,在25%–75%的治疗阈值范围内,模型净收益比“全治疗”或“不治疗”策略高0.2–0.4。
关键预测因子与机制解读
SHAP分析明确放疗靶区体积(CTVsc和CTVim)、TNM分期Ⅱ期和糖尿病状态为最重要预测因子。CTVsc和CTVim的照射会显著增加RD风险,因其直接扩大皮肤照射面积并可能引发剂量叠加效应。TNM分期Ⅱ期患者因手术范围扩大、化疗强度增加及放疗剂量较高,更易发生严重皮炎。糖尿病通过多重机制加剧RD:慢性高血糖增加活性氧(ROS)生成,微血管病变降低组织修复能力,表皮屏障功能受损进一步放大辐射敏感性。
模型优势与临床意义
本研究首次将放疗靶区参数系统整合至RD预测模型,通过SHAP解释性分析揭示特征非线性相互作用。RF模型优势在于能处理高维数据、自动评估特征重要性,且对异常值不敏感。模型在独立测试集仅出现5.29%的性能衰减,证明其强泛化能力。尽管特异性有提升空间,但高灵敏度(0.877)确保对高危患者的有效筛查,符合临床优先防范严重并发症的需求。
局限性与展望
研究的单中心设计和中等样本量可能限制外推性,病理类型因数据缺失未纳入分析。未来将通过多中心前瞻性研究扩大样本,并探索将模型嵌入放疗计划系统实现实时风险预警。当前模型已明确核心风险因子,为个体化防护策略制定提供可靠工具。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号