编辑推荐:
为解决临床显著前列腺癌的 MRI 阴性识别及与非 MRI 模型对比问题,研究人员开展机器学习分流工具的训练与性能评估研究。结果显示,U-Net 结合临床参数可减少 12.5% 放射科工作量,灵敏度降 3%、特异性升 8%,优于非成像模型。
本研究旨在训练并评估一种识别临床无显著前列腺癌 MRI 阴性的机器学习分流工具,并与非 MRI 模型比较。回顾性研究收集 2895 例 MRI(1630 例内部、1265 例公开),对比模型包括前列腺癌预防试验风险计算器 2.0、前列腺活检协作组计算器、PSA 密度、U-Net 分割及 U-Net 结合临床参数,参考标准为组织病理学或阴性随访。在 465 例患者测试集上模拟分流工作流程并计算性能指标,采用 McNemar 检验评估灵敏度和特异性差异,Leisenring、Alonzo 和 Pepe 广义得分统计量评估阳性预测值(PPV)和阴性预测值(NPV)差异,通过 Benjamini–Hochberg 校正调整等效性检验 p 值。结果显示,U-Net 结合临床参数分流使放射科医生工作量减少 12.5%,灵敏度从 93% 降至 90%(p=0.023),特异性从 39% 升至 47%(p<0.001),工作量减少幅度大于风险计算器(3.2% 和 1.3%,p<0.001),与 PSA 密度(8.4%,p=0.071)和单纯 U-Net(11.6%,p=0.762)相当。两种 U-Net 分流策略均提高 PPV(临床 + 2.8%,p=0.005;非临床 + 2.2%,p=0.020),非 U-Net 策略无此效果(p>0.05),所有场景 NPV 保持等效(p>0.05)。临床信息引导的 U-Net 分流正确排除 20 例(13.4%)放射科医生假阳性(12 例 PI-RADS=3,8 例 PI-RADS=4),8 例(3.6%)假阴性中有 2 例为放射科医生误判,且无误判为 PI-RADS 5 的病例。结论表明,基于机器学习的前列腺 MRI 分流可减少 12.5% 放射科工作量,灵敏度下降 3%、特异性提高 8%,优于非成像风险模型,需进一步前瞻性验证。