基于机器学习的 XGBoost 模型预测前列腺癌根治术后勃起功能障碍风险的研究:模型构建与验证

【字体: 时间:2025年05月20日 来源:Discover Oncology 2.8

编辑推荐:

  为解决传统预测方法难以捕捉复杂非线性风险因素的问题,研究人员开展基于机器学习的前列腺癌根治术后勃起功能障碍(ED)风险预测模型研究。构建的 XGBoost 模型 AUC 达 0.980(训练)和 0.960(验证),为个体化管理提供新工具。

  在男性健康领域,前列腺癌是全球高发恶性肿瘤之一,其根治性手术(RP)虽能显著降低死亡率,但术后勃起功能障碍(ED)作为常见并发症,严重影响患者生活质量。传统预测方法依赖线性回归和经验判断,难以捕捉年龄、手术创伤、肿瘤特征等多因素间的复杂非线性关联,导致风险分层精度不足。如何精准识别 ED 高危人群,实现个体化干预,成为临床亟待解决的难题。
为突破这一困境,南京医科大学附属淮安市第一人民医院泌尿外科团队联合无锡市人民医院开展了一项创新研究。研究团队基于 1147 例前列腺癌患者的临床数据,构建并验证了一种基于机器学习的 ED 风险预测模型,相关成果发表于《Discover Oncology》。该研究不仅揭示了术后 ED 的关键影响因素,更通过先进算法为临床提供了高效的预测工具,为优化患者管理开辟了新路径。

研究技术方法


研究采用多中心回顾性队列设计,样本来源于南京医科大学附属淮安市第一人民医院和无锡市人民医院 2020 年 1 月至 2025 年 1 月的临床数据。纳入标准严格限定为接受保留神经技术的根治术、术前勃起功能正常(IIEF-5 评分≥22)的局限性前列腺癌患者,排除合并严重基础疾病及术后辅助治疗者。通过收集 27 项术前、术中和术后变量(包括年龄、吸烟史、Gleason 评分、手术时间、降钙素原(PCT)水平等),运用 SPSS 和 R 软件进行数据预处理,将队列分为训练集(70%)、验证集(30%)及外部验证集。

研究运用四种机器学习算法 —— 极端梯度提升(XGBoost)、随机森林(RF)、支持向量机(SVM)和 k - 近邻算法(KNN),通过单因素 / 多因素分析筛选独立风险因素,并基于受试者工作特征曲线(ROC)、校准曲线、决策曲线分析(DCA)及十折交叉验证评估模型性能。此外,借助 SHapley 加性解释(SHAP)分析揭示模型决策机制,明确各因素对 ED 风险的贡献度。

研究结果


3.1 患者基线特征与关键风险因素


研究共纳入 1147 例患者,术后 ED 发生率为 24.85%(285 例)。单因素与多因素分析显示,年龄≥65 岁、吸烟史、Gleason 评分≥8、前列腺体积≥40ml、T2 期肿瘤、腹腔镜手术、手术时间≥270 分钟、术中出血 < 100ml 及 PCT≥0.05ng/ml 为独立风险因素。机器学习模型进一步筛选出核心预测因子,包括高龄、吸烟、高 Gleason 评分、前列腺体积增大、T 分期进展、腹腔镜术式及手术时间延长。

3.2 模型性能评估


XGBoost 模型在训练集和验证集中表现最优,AUC 分别为 0.980 和 0.960,显著优于 RF、SVM 和 KNN 模型。十折交叉验证显示其稳定性良好(验证 AUC:0.9127±0.0770,测试 AUC:0.9592,准确率:0.9111),外部验证 AUC 为 0.84,验证了模型的泛化能力。校准曲线显示预测概率与实际 outcomes 高度吻合,DCA 证实其临床净获益显著高于 “全治疗” 或 “全不治疗” 策略。

3.3 模型可解释性分析


SHAP 分析表明,前列腺体积≥40ml、Gleason 评分≥8、T2 期、手术时间延长、吸烟史、腹腔镜手术及高龄是 ED 风险的主要贡献因素。通过个体患者的 SHAP 力场图,可直观量化各因素对预测结果的正向或负向影响,例如高龄、吸烟及腹腔镜手术显著提升 ED 风险(如患者 1 预测概率达 0.83),而低 Gleason 评分和机器人手术则降低风险(如患者 2 预测概率仅 0.01)。

研究结论与意义


本研究构建的 XGBoost 模型在预测前列腺癌根治术后 ED 风险方面展现出卓越性能,其高准确性、稳定性及可解释性为临床提供了可靠的风险分层工具。研究证实,前列腺体积增大导致的神经血管束解剖移位、高侵袭性肿瘤(高 Gleason 评分、T 分期)引发的手术范围扩大,以及腹腔镜手术对神经保护的局限性,是术后 ED 的关键机制。机器人手术因具备 3D 高清视野、精细操作等优势,显著降低 ED 发生率,为术式选择提供了循证依据。

通过 SHAP 分析实现的个体化风险解析,使临床医生能够针对患者特异性风险因素制定精准干预策略,例如对高风险患者加强术前 counseling、优化手术方案或术后早期康复介入。该研究不仅突破了传统预测模型的局限,更推动了机器学习在泌尿外科领域的临床转化,为实现 “精准医疗” 目标奠定了重要基础。未来研究需进一步扩大样本量、纳入多中心数据,以验证模型在更广泛人群中的适用性,并探索动态风险评估的可能性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号