
-
生物通官微
陪你抓住生命科技
跳动的脉搏
开发并评估一种基于机器学习的模型在识别最初被诊断为良性前列腺增生患者的潜在前列腺癌方面的有效性:一项回顾性队列研究
《BMC Medical Informatics and Decision Making》:Development and interpretability of a machine learning-derived model for the identification of latent prostate cancer in patients initially diagnosed with benign prostatic hyperplasia: a retrospective cohort study
【字体: 大 中 小 】 时间:2026年06月10日 来源:BMC Medical Informatics and Decision Making 3.8
编辑推荐:
摘要背景前列腺癌(PCa)的特点是肿瘤内异质性和多灶性明显,这给早期和精准诊断带来了持续的挑战。在临床实践中,最初被诊断为良性前列腺增生(BPH)的患者中,有很大一部分在后续随访中被发现潜伏着前列腺癌。然而,目前基于前列腺特异性抗原(PSA)的筛查方法缺乏解决这种诊断重叠所需的特
前列腺癌(PCa)的特点是肿瘤内异质性和多灶性明显,这给早期和精准诊断带来了持续的挑战。在临床实践中,最初被诊断为良性前列腺增生(BPH)的患者中,有很大一部分在后续随访中被发现潜伏着前列腺癌。然而,目前基于前列腺特异性抗原(PSA)的筛查方法缺乏解决这种诊断重叠所需的特异性。本研究旨在开发并内部验证一种可解释的机器学习(ML)模型,作为PSA检测的补充手段,用于识别最初被诊断为BPH的患者中的潜伏前列腺癌。
这项回顾性队列研究利用了1,071名患者的数据,开发了一个机器学习框架,旨在识别在初次BPH评估至少6个月后发现的潜在前列腺癌。该队列被分为训练集(70%)和测试集(30%)。在训练集中,使用递归特征消除(RFE)方法来确定一个简洁的生物标志物特征组合。评估了六种机器学习算法:逻辑回归(LR)、随机森林(RF)、极端梯度提升(XGB)、支持向量机(SVM)、k近邻(KNN)和多层感知器(MLP)。模型性能通过接收者操作特征曲线下面积(AUROC)、布里尔分数(Brier score)和决策曲线分析(DCA)进行评估。通过SHapley加性解释(SHAP)和局部加权散点图平滑(LOWESS)分析来提高模型的可解释性。
确定了一个由总前列腺特异性抗原(tPSA)、乳酸脱氢酶(LDH)、红细胞计数(RBC)和肌酸激酶-MB(CK-MB)组成的简洁的四生物标志物特征组合。MLP和LR模型表现出较高的诊断性能,其测试AUROC值分别为0.949和0.946。
本研究开发并内部验证了一个可解释的机器学习框架,旨在补充传统的PSA筛查方法。该工具仅用于研究目的。
前列腺癌(PCa)的特点是肿瘤内异质性和多灶性明显,这给早期和精准诊断带来了持续的挑战。在临床实践中,最初被诊断为良性前列腺增生(BPH)的患者中,有很大一部分在后续随访中被发现潜伏着前列腺癌。然而,目前基于前列腺特异性抗原(PSA)的筛查方法缺乏解决这种诊断重叠所需的特异性。本研究旨在开发并内部验证一种可解释的机器学习(ML)模型,作为PSA检测的补充手段,用于识别最初被诊断为BPH的患者中的潜伏前列腺癌。
这项回顾性队列研究利用了1,071名患者的数据,开发了一个机器学习框架,旨在识别在初次BPH评估至少6个月后发现的潜在前列腺癌。该队列被分为训练集(70%)和测试集(30%)。在训练集中,使用递归特征消除(RFE)方法来确定一个简洁的生物标志物特征组合。评估了六种机器学习算法:逻辑回归(LR)、随机森林(RF)、极端梯度提升(XGB)、支持向量机(SVM)、k近邻(KNN)和多层感知器(MLP)。模型性能通过接收者操作特征曲线下面积(AUROC)、布里尔分数(Brier score)和决策曲线分析(DCA)进行评估。通过SHapley加性解释(SHAP)和局部加权散点图平滑(LOWESS)分析来提高模型的可解释性。
确定了一个由总前列腺特异性抗原(tPSA)、乳酸脱氢酶(LDH)、红细胞计数(RBC)和肌酸激酶-MB(CK-MB)组成的简洁的四生物标志物特征组合。MLP和LR模型表现出较高的诊断性能,其测试AUROC值分别为0.949和0.946。
本研究开发并内部验证了一个可解释的机器学习框架,旨在补充传统的PSA筛查方法。该工具仅用于研究目的。