使用混合机器学习和可解释人工智能预测睾丸扭转中的睾丸切除术:一个基于网络的临床决策支持系统

《World Journal of Urology》:Predicting orchiectomy in testicular torsion using hybrid machine learning and explainable AI: a web-based clinical decision support system

【字体: 时间:2026年06月09日 来源:World Journal of Urology 2.9

编辑推荐:

  目的 旨在利用混合机器学习(hybrid machine learning, ML)和可解释人工智能(explainable artificial intelligence, XAI)技术开发一个高精度预测模型,用于区分睾丸扭转(testicular to

  
目的
旨在利用混合机器学习(hybrid machine learning, ML)和可解释人工智能(explainable artificial intelligence, XAI)技术开发一个高精度预测模型,用于区分睾丸扭转(testicular torsion, TT)中的睾丸切除术与扭转复位术,并创建用于临床的交互式网络应用程序和列线图。

材料与方法
回顾性分析了于2005年1月至2025年6月期间在研究人员所在诊所接受手术治疗的117例TT患者数据(扭转复位术:83例,睾丸切除术:34例)。从二十个初始特征中,使用混合粒子群优化-灰狼优化(Particle Swarm Optimization-Grey Wolf Optimization, PSO-GWO)算法选择了七个最优特征。采用SVMSMOTE处理类别不平衡问题。比较了四种集成学习算法,并选择CatBoost作为最终模型。为提升模型可解释性,进行了SHAP、LIME、部分依赖图(Partial Dependence Plot, PDP)和个体条件期望(Individual Conditional Expectation, ICE)分析。使用逻辑回归开发了一个七特征列线图。利用Python Dash创建了一个双模块网络应用程序。

结果
PSO-GWO识别出七个最优特征(年龄、症状持续时间、PDW、PCT、MPV、MLR、SII)。CatBoost表现出最高性能(AUC: 0.923,准确率: 89.5%)。XAI分析确定症状持续时间是最强预测因子(SHAP: 52.72%),其次为MLR(14.24%)和PDW(12.09%)。PDW作为一种此前在文献中极少被研究的新型生物标志物出现,却显示出强大的区分能力(逆相关关系,截断值<17.9 fL)。PDP分析揭示在约7小时处存在一个明显的拐点,与ROC截断值相吻合。ICE分析显示出显著的个体异质性(得分>0.36)。列线图表现出良好的区分能力(AUC: 0.818)和极佳的校准度(Hosmer-Lemeshow p=0.556)。研究人员开发了一个简化三特征风险评分系统(0–3分)。该网络应用程序(medicalinformaticsttrc.adiyaman.edu.tr)提供实时风险计算(<50 ms)。

结论
采用混合PSO-GWO算法和XAI技术开发的CatBoost模型在预测TT中睾丸切除术方面实现了高精度。PDW被确定为一种新颖、实用且成本效益高的生物标志物。所开发的网络应用程序和风险评分系统可能有助于急诊科的术前咨询、手术准备和临床决策。“扭转复位术”结局指示术中未切除睾丸,但并不确认长期睾丸存活能力。该探索性模型在临床采用前需要外部验证和多中心前瞻性研究。
论文解读文章

**研究背景与问题**
睾丸扭转(testicular torsion, TT)是一种泌尿外科急症,其发病率在近二十年来呈上升趋势,在25岁以下男性中约为1/4000,若不及时干预,可导致睾丸坏死并需要行睾丸切除术,进而影响生育功能。不可逆损伤与坏死具有时间依赖性,关键窗口期约为4至6小时。当前诊断依赖病史、临床体征、TWIST评分及多普勒超声(Doppler US),但这些参数无法清晰预测睾丸活力。现有文献多采用传统统计方法,虽报道症状持续时间、扭转程度及血液学参数与活力相关,但受限于变量选择方法的非线性处理能力,预测性能欠佳。机器学习(machine learning, ML)方法在手术结局预测中展现出优于经典统计的潜力,但“黑箱”特性限制了临床转化。因此,研究人员旨在利用混合机器学习和可解释人工智能(explainable artificial intelligence, XAI)技术,开发高精度预测模型,以区分TT患者术前是否需要睾丸切除术,并构建临床适用的决策支持工具,以支持术前咨询、手术准备及临床决策。该论文发表在《World Journal of Urology》。

**关键技术方法**
研究人员回顾性分析了2005年1月至2025年6月期间在Ad?yaman大学医学院附属医院接受手术治疗的117例TT患者(扭转复位术83例,睾丸切除术34例)。关键技术包括:采用混合粒子群优化-灰狼优化(Particle Swarm Optimization-Grey Wolf Optimization, PSO-GWO)算法从20个初始特征中筛选最优特征集;应用SVMSMOTE过采样方法处理类别不平衡(2.44:1);比较四种集成学习算法(CatBoost、LightGBM、Gradient Boosting、Bagging),并基于10折分层交叉验证选择CatBoost作为最终模型;利用SHAP、LIME、部分依赖图(Partial Dependence Plot, PDP)和个体条件期望(Individual Conditional Expectation, ICE)进行模型可解释性分析;基于逻辑回归开发七特征列线图;使用Python Dash框架创建包含实时预测模块(CatBoost)和交互式列线图模块的双模块网络应用程序。

**研究结果**

*Univariate analysis*
与扭转复位组相比,睾丸切除术组的症状持续时间显著更长(p_FDR<0.001,Cliff's δ=0.719),单核细胞计数及单核细胞-淋巴细胞比率(monocyte-to-lymphocyte ratio, MLR)显著升高(p_FDR分别为0.011和0.016),而血小板分布宽度(platelet distribution width, PDW)显著降低(p_FDR=0.016,δ=?0.343)。中性粒细胞-淋巴细胞比率(NLR)和血小板-淋巴细胞比率(PLR)组间差异无统计学意义。

*Feature selection and model performance*
在九种特征选择方法中,混合PSO-GWO算法表现最优,以平均马修斯相关系数(Matthews Correlation Coefficient, MCC)0.705±0.092筛选出七个特征:年龄、症状持续时间、PDW、血小板压积(PCT)、平均血小板体积(MPV)、MLR、全身免疫-炎症指数(SII)。

*Imbalanced dataset management and performance improvement*
SVMSMOTE在八种采样策略中性能最佳(MCC=0.713),较无采样基线模型提升49.7%。

*Model performance comparison*
CatBoost在10折交叉验证中取得最高准确率(89.5%)、MCC和F1-score,AUC为0.923。LightGBM的AUC略高(0.927),但差异无统计学意义。CatBoost的阳性预测值(PPV)为85.6%,阴性预测值(NPV)为95.5%。

*Feature importance and model interpretability with explainable artificial intelligence*
四种XAI方法(SHAP、LIME、模型内置、排列重要性)均一致识别症状持续时间为主导预测因子(SHAP: 52.72%),其次为MLR(14.24%)和PDW(12.09%)。PDP分析表明,症状持续时间在约7小时处出现明显拐点(0–7小时快速上升,随后进入平台期);PDW在17.9 fL处呈现强烈逆相关关系(风险变化Δ=0.209);MLR在0.29处单调递增(Δ=0.155)。双变量PDP显示症状持续时间×PDW存在强协同效应(风险范围0.895),短症状伴高PDW与<10%风险相关,长症状伴低PDW则风险>85%。ICE分析显示所有特征异质性评分>0.36,提示需进行个体化风险评估。

*Nomogram development and validation*
基于逻辑回归的七特征列线图(年龄、症状持续时间、PDW、PCT、MPV、MLR、SII)显示出良好区分能力(AUC: 0.818)和极佳校准度(Hosmer-Lemeshow检验p=0.556,Brier评分0.165)。MLR为最强正向预测因子(β=+0.765),PDW为最强负向预测因子(β=?0.595)。

*Interactive web application for testicular torsion surgical risk prediction*
开发的双模块网络应用程序(medicalinformaticsttrc.adiyaman.edu.tr)可在<50 ms内基于患者参数计算风险百分比、风险等级(低/中/高/极高)、风险评分(0–3分)并提供临床建议;交互式列线图模块可通过滑块实时计算各特征分数及总风险。

**讨论总结与结论**
讨论部分指出,AI在泌尿系统疾病诊断与预后预测中广泛应用,但TT的睾丸活力预测仍为临床难题。本研究首次系统整合混合元启发式特征选择(PSO-GWO)、集成机器学习(CatBoost)、全面XAI技术(SHAP、LIME、PDP、ICE)、列线图及交互式网络决策支持系统。PDW作为新发现生物标志物,其逆相关关系具有生物学合理性:急性炎症状态下微循环中较大反应性血小板消耗增加导致PDW降低。PDW来自常规血常规(CBC),无额外成本且5分钟内可得。简化三特征风险评分(症状持续时间>7小时、PDW<17.9 fL、MLR>0.29各1分)可用于床旁快速评估:0–1分示低风险(~0–5%),2分示中风险(~44%),3分示高风险(100%)。决策曲线分析表明CatBoost模型在整个临床相关阈值范围内(0.10–0.80)均产生净获益。研究局限性包括回顾性设计、样本量小(n=117,事件每变量比约4.9)、单中心、缺乏术后随访数据(睾丸萎缩或功能性结局)及外部验证。

**结论**
采用混合PSO-GWO和CatBoost开发的模型在预测睾丸扭转中的睾丸切除术方面实现了高精度(AUC: 0.923,MCC: 0.796)。XAI分析确定症状持续时间是最强预测因子(SHAP: 52.72%),并识别PDW为新型生物标志物。列线图、风险评分和网络应用程序为术前咨询、手术准备和临床决策支持提供了实用工具。应指出,“扭转复位术”结局反映术中未切除睾丸,并不确认长期睾丸存活能力。PDW是一种实用且强大的候选生物标志物,可在常规CBC中无额外成本测量。然而,该探索性模型需要在多中心前瞻性队列中进行外部验证,且在临床应用前需对PDW的病理生理机制进行研究。未来研究方向包括更大的外部验证队列(>500例)、扩展特征集(超声及手术发现)、PDW机制阐明、年龄特异性模型以及网络应用程序的临床影响分析。本研究突显了人工智能在医疗决策支持系统中的潜力以及临床医学数字化转型的重要性。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号