编辑推荐:
子宫内膜异位症严重影响女性生活质量,目前缺乏可靠的术前预测重度子宫内膜异位症的模型。研究人员开展了相关回顾性研究,构建多个机器学习(ML)模型,发现随机森林(RF)模型表现最佳。该研究有助于早期识别高危患者,优化治疗策略。
在女性健康的领域中,子宫内膜异位症就像一颗隐藏的 “定时炸弹”,悄无声息地影响着众多女性的生活。这是一种常见的慢性炎症性疾病,其特征是子宫外出现类似子宫内膜的组织。它与痛经、盆腔疼痛、不孕、排尿困难和深部性交痛等问题紧密相连,对育龄女性的生活质量造成了极大的威胁,发病率也在不断攀升,目前已达 10%。
子宫内膜异位症有多种类型,如卵巢子宫内膜异位症(OE)、腹膜子宫内膜异位症(PE)、深部子宫内膜异位症(DE)等 。为了更好地描述这种复杂的疾病,人们制定了多种分类系统,其中修订后的美国生殖医学学会(rASRM)分类系统应用最为广泛。该系统主要依据腹腔镜手术中观察到的植入物的位置、大小、深度以及粘连程度,将子宫内膜异位症分为四个阶段,从轻度到重度(I 期到 IV 期)。不同阶段的治疗方案差异很大,包括药物治疗、手术治疗或两者结合,具体取决于疾病的程度、位置、症状的严重程度以及患者的生育意愿。
然而,对于重度子宫内膜异位症患者来说,治疗面临着诸多挑战。腹腔镜手术虽然是治疗的重要手段,但由于盆腔解剖结构的改变和广泛的粘连,手术难度大幅增加,并发症的风险也很高。而且,传统的诊断金标准 —— 腹腔镜检查,不仅成本高昂,还存在一定风险。如果能在手术前通过临床数据准确预测重度子宫内膜异位症,医生就能充分了解患者的病情,制定更合理的围手术期方案和治疗决策,比如术前使用促性腺激素释放激素(GnRH)激动剂。但遗憾的是,目前还没有可靠的无创预测模型来实现这一目标。
为了解决这一难题,中国医科大学附属第一医院的研究人员开展了一项极具意义的研究。他们从 2019 年 12 月至 2023 年 12 月期间在该院妇科和超声科就诊的患者中,筛选出 471 例符合条件的患者,最终纳入 308 例进行分析。这些患者均接受了手术治疗,并通过术后病理确诊为子宫内膜异位症。
研究人员首先采用了最小绝对收缩和选择算子(LASSO)回归进行特征选择,从 39 个变量中筛选出 18 个潜在的风险因素。接着,运用 7 种机器学习(ML)算法构建预测模型,包括逻辑回归(LR)、递归划分和回归树(rpart)、随机森林(RF)、极端梯度提升(XGBoost)、支持向量机(SVM)、k 近邻(KNN)和神经网络(NNET)。通过比较这些模型的性能,研究发现随机森林(RF)模型在预测重度子宫内膜异位症方面表现最为出色,其受试者工作特征曲线下面积(AUROC)达到了 0.744 。
进一步根据特征重要性对 RF 模型进行特征降维,最终确定了包含 6 个特征的可解释最终模型,这 6 个特征分别是阴性滑动征、盆腔积液(PFOC)、双侧卵巢子宫内膜异位症(OE)、严重痛经、嗜酸性粒细胞百分比和月经周期相关症状(MCRS)。该模型在训练集和测试集的 AUROC 分别为 0.865 和 0.720 。
为了深入理解模型的决策过程,研究人员运用了 SHapley Additive exPlanations(SHAP)方法进行解释。结果发现,阴性滑动征对 RF 模型的诊断性能影响最大。在实际应用中,通过 SHAP 分析可以为临床医生提供个性化的风险评估,帮助他们理解模型预测结果背后的原因,从而更好地制定治疗方案。
这项研究成果意义重大。它为重度子宫内膜异位症的风险预测提供了一种新的、有效的工具,有助于早期识别高风险患者,实现更精准的治疗,改善患者的预后。同时,也为后续研究提供了重要的参考,推动了子宫内膜异位症诊断和治疗领域的发展。
研究人员开展这项研究用到的主要关键技术方法包括:
- 数据筛选与分组:从中国医科大学附属第一医院收集患者数据,依据纳入和排除标准筛选出 308 例患者,按照 rASRM 系统分为重度和非重度组,再按 8:2 的比例随机分为训练集和测试集。
- 特征选择:使用 LASSO 回归从 39 个变量中筛选出 18 个潜在风险因素。
- 模型构建与评估:运用 7 种 ML 算法构建预测模型,通过 AUROC 和准确性分析评估模型性能,经网格搜索和 10 折交叉验证确定最终模型。
- 模型解释:利用 SHAP 方法对最终模型进行解释,分析各特征对模型预测的贡献。
下面详细介绍研究结果:
- 患者基线特征:纳入研究的 308 例患者中,重度子宫内膜异位症的发生率约为 59.2%(183/308)。比较重度和非重度组患者的术前变量和人口统计学特征,发现两组之间无统计学差异(p>0.05)。训练集和测试集的患者特征也无显著差异。
- 预测模型独立特征选择:通过 LASSO 回归分析,确定了 18 个与重度子宫内膜异位症相关的特征,包括阴性滑动征、双侧 OE、PFOC、严重痛经等。
- 多模型综合分析:利用 LASSO 回归筛选出的 18 个特征构建 7 种 ML 模型,结果显示 RF 模型在预测重度子宫内膜异位症方面表现最佳。在 RF 模型中,阴性滑动征是最具影响力的特征。
- 最终模型的确定:对 RF 模型进行特征降维,确定了包含 6 个特征的最终模型。该模型在训练集和测试集上都具有较好的性能,AUC 分别为 0.865 和 0.720 。
- 最终模型的解释:运用 SHAP 方法对最终模型进行解释,从全局和个体层面展示了各特征对模型预测的贡献。例如,阴性滑动征和双侧 OE 对重度子宫内膜异位症的预测有正向贡献,而在非重度患者中,这些特征的贡献为负。
在研究结论和讨论部分,研究人员指出,与非重度子宫内膜异位症相比,重度子宫内膜异位症的盆腔解剖结构改变更明显,粘连更广泛,腹腔镜手术风险高。他们构建的基于机器学习的预测模型,能够利用常规临床和超声数据预测重度子宫内膜异位症,在训练集和测试集上都取得了较好的诊断性能。阴性滑动征和 PFOC 等超声标志物对重度子宫内膜异位症的诊断具有重要意义。虽然该研究存在一定的局限性,如回顾性单中心设计、样本量较小、rASRM 分期系统存在局限性等,但总体而言,这项研究为重度子宫内膜异位症的诊断和治疗提供了新的思路和方法,具有重要的临床价值,为未来的研究奠定了基础,有望推动相关领域的进一步发展 。