根管治疗牙齿的修复效果持久性:基于随机临床试验的机器学习生存分析

《INTERNATIONAL ENDODONTIC JOURNAL》:Restoration's Longevity in Endodontically Treated Teeth: A Machine Learning Survival Analysis From Randomised Clinical Trials

【字体: 时间:2025年10月17日 来源:INTERNATIONAL ENDODONTIC JOURNAL 7.1

编辑推荐:

  长期修复体预测:基于四个临床试验的机器学习生存分析模型开发。整合荷兰和巴西四项临床试验数据(424患者,618修复体,最长17年随访),采用梯度提升生存模型、随机生存森林和生存支持向量机三种算法,评估时间依赖AUC(0.83)、C-index(0.80)等指标。结果表明梯度提升生存模型在生存率预测中最佳,随机生存森林在成功率预测中更优。SHAP分析显示年龄、牙齿类型和牙医经验为关键预测因子,同时存在性别和地区间的性能差异。研究证实ML模型在评估根管治疗牙齿修复体长期效果中具有潜力,但需进一步外部验证和公平性优化。

  本研究旨在开发一种机器学习(ML)生存模型,以评估根管治疗牙齿(ETT)修复体的长期成功和存活率。随着现代牙科技术的不断发展,对ETT进行修复时,临床医生面临着多种治疗方案的选择,这些方案在成本、美学效果和治疗成功率等方面各有不同。因此,能够准确预测修复体长期表现的工具显得尤为重要。本研究通过整合来自荷兰和巴西的四项随机对照试验(RCT)数据,分析了不同修复方法对ETT长期存活和成功的影响,并利用机器学习模型进行预测,为临床决策提供科学依据。

研究团队选取了424名患者和618个修复体,涵盖了长达17年的随访数据。这些数据来自多个研究,其中包括荷兰的两个研究和巴西的两个研究。研究中涉及的修复体类型包括金属陶瓷冠、复合树脂修复体以及使用不同类型的桩核结构的修复体。通过合并这些数据,研究者能够构建一个更具代表性和预测能力的数据集,为机器学习模型的训练和测试提供充足的基础。数据集的构建过程严格遵循伦理规范,并获得了相关机构的批准。

研究采用三种生存分析模型进行比较:梯度提升生存模型(Gradient Boosting Survival, GBS)、随机生存森林(Random Survival Forests, RSF)和生存支持向量机(Survival Support Vector Machine, SSVM)。这些模型在训练集和测试集中分别进行了评估,以衡量其在不同时间点上的预测能力。在评估过程中,研究者采用了多种性能指标,包括时间依赖的ROC曲线下面积(AUC)、一致性指数(C-index)、逆概率删失权重一致性指数(IPCW C-index)和时间依赖的Brier分数。这些指标能够有效衡量模型在处理生存数据时的判别能力和校准性能。

结果显示,梯度提升生存模型在预测ETT修复体的存活率方面表现最佳,其时间依赖AUC为0.83(95%置信区间为0.81–0.87),C-index为0.80,IPCW C-index为0.78,Brier分数为0.06。这表明该模型在长期预测中具有较高的稳定性。相比之下,随机生存森林模型在预测成功率方面表现更优,其时间依赖AUC为0.73(95%置信区间为0.70–0.75),C-index为0.66,IPCW C-index为0.64,Brier分数为0.14。这说明成功率的预测更加依赖于修复过程中的细节,如牙医经验、材料选择和牙齿类型等。生存支持向量机模型的表现相对较弱,这可能与其对生存函数的估计能力有限有关。

通过SHAP(Shapley Additive ExPlanations)分析,研究团队进一步揭示了影响模型预测的关键变量。在预测存活率时,患者年龄和牙齿类型(尤其是磨牙)被识别为最重要的预测因子。年龄较大的患者更容易出现修复失败,这可能与牙齿结构随时间而产生的疲劳、微裂等现象有关。而磨牙由于承受更大的咬合力,其修复失败的概率也相对较高。在预测成功率时,牙医经验则被发现是最重要的变量。经验丰富的牙医在修复过程中能够减少技术性错误,从而提高修复体的长期成功率。此外,玻璃纤维桩、缺乏牙冠边缘(ferrule)和使用复合树脂材料也被识别为影响修复成功的重要因素,而牙冠则被认为具有保护作用。

模型的公平性分析也显示出重要的结果。研究发现,男性在预测存活率时的表现优于女性,而随机生存森林模型在预测成功率时也表现出对男性更高的预测准确性。这表明模型在不同性别群体中的预测能力存在差异,可能受到数据分布不均的影响。因此,未来的研究需要更加关注模型的公平性,确保其在不同患者群体中的预测结果具有可比性和一致性。同时,研究还指出,当前的数据集缺乏关于种族、社会经济状况等变量的信息,这可能影响模型对某些群体的预测能力,进而导致潜在的偏倚。因此,未来的研究应努力扩大数据集的多样性,以提高模型的泛化能力和公平性。

研究还强调了模型在临床应用中的潜力。尽管机器学习模型在预测ETT修复体的长期表现方面表现优异,但其实际应用仍需依赖高质量的数据输入。数据的准确性和完整性对于模型的预测能力至关重要,因此,临床医生需要在数据收集过程中保持严谨,确保信息的全面性。此外,模型的可解释性也是其应用的关键因素。通过SHAP分析,研究者能够清晰地展示各个变量对预测结果的影响,从而帮助临床医生更好地理解模型的决策过程,并基于模型的建议做出更加科学的治疗选择。

尽管本研究取得了一定的成果,但也存在一些局限性。首先,由于数据来源于多个RCT,每个研究可能采用不同的修复方法,这可能导致研究之间的混淆因素。为此,研究团队对不同修复类型进行了分层分析,结果显示模型的性能指标在不同修复类型之间保持一致,表明预测结果具有一定的普遍性。然而,这种一致性并不意味着完全排除了研究间的干扰,因此在解释模型结果时仍需谨慎。其次,研究中的随访时间在不同地区存在差异,这可能影响模型在不同时间尺度上的表现。因此,未来的研究需要进一步探索模型在不同随访时间范围内的适应性,以确保其在更广泛的应用场景中具有稳定性。

此外,本研究没有采用时间依赖的传统分类指标,如准确率、灵敏度和特异性。这些指标在生存分析中并不适用,因为它们假设结果是时间不变的,无法准确反映删失数据或时间动态性。虽然这些指标的数学基础已经建立,但它们在生存分析软件中的应用仍有限。因此,未来的研究可以探索如何将这些指标整合到生存分析模型中,以进一步提升模型的评估能力。

总的来说,本研究首次将机器学习生存分析应用于牙科领域,展示了其在预测ETT修复体长期表现方面的潜力。研究结果表明,机器学习模型能够有效整合患者和牙齿的特征,以及修复材料的差异,从而提供更加精准的预测。然而,为了提高模型的实用性,未来的研究需要进一步扩大数据集的规模和多样性,并进行外部验证,以确保其在不同临床环境中的适用性。同时,提升模型的公平性和可解释性也是重要的发展方向,这有助于增强临床医生对模型的信任,并促进其在实际诊疗中的广泛应用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号