基于机器学习构建列线图模型:精准预测非梗阻性无精子症的前沿突破

【字体: 时间:2025年02月15日 来源:Scientific Reports 3.8

编辑推荐:

  为解决区分梗阻性和非梗阻性无精子症(OA 和 NOA)的难题,福建医科大学附属第一医院研究人员开展相关研究。他们利用机器学习构建列线图模型预测 NOA,结果理想。推荐科研读者阅读,助于深入了解男性不育症诊断新策略。

  
福建医科大学附属第一医院(Department of Andrology and Sexual Medicine, First Affiliated Hospital of Fujian Medical University)的研究人员 Hong Xiao、Yi-lang Ding 等在《Scientific Reports》期刊上发表了题为 “Developing a nomogram model for predicting non-obstructive azoospermia using machine learning techniques” 的论文。这篇论文在男性不育症研究领域意义重大,为非梗阻性无精子症(non-obstructive azoospermia,NOA)的诊断和治疗提供了新的思路和方法,有望推动个性化医疗在该领域的发展。

研究背景


无精子症(Azoospermia)是指精液中没有精子,它是男性不育症中较为严重的一种形式,大约影响 1% 处于生育高峰期的男性。无精子症分为梗阻性无精子症(obstructive azoospermia,OA)和非梗阻性无精子症(NOA),其中 OA 约占 40%,是由于生殖道堵塞阻碍了正常的睾丸生精功能;而 NOA 则是睾丸内精子生成不足或缺失 。区分 OA 和 NOA 对于制定优化的治疗策略至关重要,因为这两种病症的治疗方法差异很大。

然而在临床实践中,区分 OA 和 NOA 面临诸多挑战。当前,区分两者通常需要进行侵入性检查,如睾丸活检或精子提取技术,但这些方法在基层男科或资源有限的环境中可能无法开展。虽然也有非侵入性方法,如激素评估和超声成像,但它们的敏感性和特异性往往不足,难以提供明确的诊断。此外,目前的诊断标准在不同研究中存在差异,缺乏统一且可靠的诊断工具。因此,开发更易获取、可靠的诊断工具迫在眉睫,这对于确保所有患者都能得到及时准确的诊断,打破地理和经济障碍,以及指导最佳治疗决策具有重要意义。

研究方法


  1. 研究对象和观察指标:研究人员对 2020 年 1 月至 2024 年 2 月期间福建医科大学附属第一医院男科和性医学科收集的 352 例无精子症患者进行了回顾性研究。该研究获得了医院医学伦理委员会的批准,并遵循赫尔辛基宣言的原则,所有参与者均签署了知情同意书。排除患有低促性腺激素性性腺功能减退症、年龄小于 14 岁以及临床数据不完整的患者。详细记录患者的病史,包括睾丸炎、附睾炎、腮腺炎、既往睾丸创伤和手术、隐睾症等情况,同时考虑潜在的医源性因素。通过 Prader 睾丸测量器测量睾丸体积(testicular volume,TV),计算平均睾丸体积(mean testicular volume,MTV);多次评估射精量和精液 pH 值并取平均值;检测血清中催乳素、卵泡刺激素(follicle-stimulating hormone,FSH)、黄体生成素(luteinizing hormone,LH)、雌二醇、睾酮(testosterone,T)和抑制素 B(inhibin B,INHB)的水平;通过体格检查结合彩色多普勒超声诊断精索静脉曲张;对初步诊断为 NOA 的患者进行外周血染色体核型分析和 Y 染色体微缺失分析,对 OA 患者进行彩色多普勒超声或磁共振成像检查以确定梗阻部位 。
  2. 睾丸组织病理学分析:将睾丸组织石蜡包埋,切成 4μm 厚的切片,进行常规苏木精 - 伊红染色,在光学显微镜下观察。仅存在支持细胞(Sertoli cells)的情况分类为唯支持细胞综合征(Sertoli cell only syndrome,SCOS);有精原细胞、初级精母细胞、次级精母细胞或精子细胞但无成熟精子的诊断为成熟停滞(maturation arrest,MA);能观察到少量成熟精子的为精子发生减少(hypospermatogenesis)。根据主要的组织病理学模式进行诊断,患有 SCOS、MA 或精子发生减少的患者归类为 NOA,而精子发生正常或接近正常的标本归类为 OA。
  3. 统计分析:使用 SPSS 27.0 软件进行统计分析,连续变量以均值 ± 标准差或中位数和四分位数间距表示,分类变量以频率或百分比表示。通过 Shapiro-Wilk 检验评估数据分布,Levene 检验评估方差齐性,非正态分布的连续变量用 U 检验比较,Pearson 卡方检验和 Fisher 精确概率检验用于比较组间率。进行单变量和多变量逻辑回归分析以确定独立危险因素。利用 R 4.2.3 软件构建机器学习算法和列线图(nomogram)模型,采用 9 种不同的机器学习算法进行建模,包括随机森林(Random Forest)、梯度提升决策树(Gradient Boosting Decision Trees,GBDT)、XGBoost、LightGBM、朴素贝叶斯(Naive Bayes)、支持向量机(Support Vector Machine,SVM)、逻辑回归(Logistic Regression)、决策树(Decision Trees)和神经网络(Neural Networks),并对各算法的超参数进行优化以防止过拟合。使用受试者工作特征曲线(receiver operating characteristic curve,ROC)下面积评估预测性能,通过校准曲线和决策曲线分析(decision curve analysis,DCA)评估模型的准确性和临床实用性,以 P < 0.05 为差异具有统计学意义。

研究结果


  1. 基本信息:研究共纳入 352 例无精子症患者,其中 OA 患者 152 例(43.47%),NOA 患者 200 例(56.82%)。在 OA 患者中,31.58% 伴有精索静脉曲张,其中单侧精索静脉曲张 34 例,双侧 14 例,至少一侧为重度精索静脉曲张 6 例。NOA 患者中,包括 30 例克氏综合征(Klinefelter syndrome)、12 例 Y 染色体微缺失、18 例双侧隐睾症手术史、11 例获得性 NOA 和 129 例特发性 NOA,36.50% 伴有精索静脉曲张,其中单侧 44 例,双侧 29 例,至少一侧为重度精索静脉曲张 9 例。
  2. 机器学习方法分析:将数据按照 7:3 的比例随机分为训练集(244 例)和验证集(108 例),两组之间无显著差异(P > 0.05)。单变量和多变量逻辑回归分析显示,精液 pH 和 FSH 与 NOA 呈正相关,MTV 和 INHB 与 NOA 呈负相关。基于这四个因素,使用 9 种机器学习方法进一步分析和优化模型。结果显示,GBDT 的表现最佳,曲线下面积(area under the curve,AUC)为 0.974,随机森林的 AUC 最低,为 0.953。除 GBDT 和随机森林外,其他 7 种模型的 AUC 值与 GBDT 相比无显著差异(P > 0.05)。
  3. 建立和验证列线图模型:通过综合多变量分析,开发了一种新的列线图模型,该模型纳入了 FSH、MTV、INHB 和精液 pH 四个独立变量来预测无精子症患者的 NOA,其中 FSH 是主要预测因子。ROC 曲线显示,该列线图模型在训练集和验证集中的 AUC 分别为 0.984 和 0.976,具有较强的预测性能。校准曲线表明模型预测结果与实际观察结果吻合良好(Hosmer-Lemeshow 检验 P 值大于 0.05),DCA 分析也显示该模型具有较高的临床净效益。确定了几种生物标志物的最佳截断点:FSH 为 7.50 IU/L(AUC = 0.96,敏感性 = 91.50%,特异性 = 93.20%);INHB 为 43.45 pg/ml(AUC = 0.95,敏感性 = 100.0%,特异性 = 82.30%);MTV 为 9.92ml(AUC = 0.91,敏感性 = 99.00%,特异性 = 75.90%);精液 pH 为 6.95(AUC = 0.71,敏感性 = 97.90%,特异性 = 42.7%)。在验证集中,使用不同截断值预测 NOA 的比例分别为:INHB <43.45 pg/ml 时为 100.00%(48/48),FSH> 7.5 IU/L 时为 96.30%(52/54),MTV < 9.92 ml 时为 95.00%(38/40),pH > 6.95 时为 63.74%(58/91),精液 pH 的截断值在验证集中的 NOA 预测率低于其他三个生物标志物(P < 0.05)。

研究结论与讨论


研究人员利用 9 种机器学习算法和基本的男性生育参数构建了预测 NOA 的列线图模型,经过验证,该模型能够准确识别 NOA,为无精子症患者的个性化诊断和治疗提供了有价值的工具。

在众多预测因子中,FSH 被发现是预测 NOA 最有效的指标。FSH 由垂体前叶分泌,作用于表达 FSH 受体的支持细胞,在睾丸发育过程中对支持细胞数量的调节至关重要,进而影响成年男性的生殖细胞数量。不同研究报道的 FSH 临界值存在差异,可能与种族和地区差异有关,这提示男科医生在评估无精子症患者时,应根据种族和地区差异调整诊断标准。INHB 由支持细胞分泌,对 FSH 有直接抑制作用,在一定程度上可作为精子生成的指标。研究发现 NOA 患者的精液 pH 值常为 “正常”,虽然它在预测 NOA 方面的效果不如其他参数,但在区分某些类型的无精子症上仍有一定价值。

除了本研究纳入的参数外,还有许多其他参数在区分 OA 和 NOA 方面具有潜力。例如精液量、血浆瘦素、血清瘦素、睾丸内血管数量、输精管异常、实时弹性成像应变比、磁共振成像的表观扩散系数(apparent diffusion coefficient,ADC)等。然而,这些参数在实际应用中存在一些局限性,如部分检查需要先进的医疗设备、成本高、等待时间长,或者其预测价值还需要进一步评估。此外,还有一些新兴的生物标志物,如精浆富含半胱氨酸分泌蛋白 1(seminal plasma cysteine-rich secretory protein 1)、精浆睾丸表达蛋白 101(seminal plasma testis-expressed protein 101)等,但目前它们的敏感性和特异性仍不如本研究开发的新模型。

该研究也存在一些局限性。首先,缺乏在其他患者队列中的外部验证,限制了预测模型的普遍性和稳健性;其次,NOA 和 OA 的精确分类定义在科学界仍存在争议;最后,缺乏足够可靠和可重复的成像技术,限制了模型的准确性和便利性。未来需要开展多中心研究来解决这些问题,进一步提高模型的适用性。

总的来说,这项研究为非梗阻性无精子症的诊断开辟了新途径,通过机器学习构建的列线图模型为临床医生提供了更精准的诊断工具,尽管存在不足,但为后续研究指明了方向,有望推动男性不育症诊断和治疗领域的进一步发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号