编辑推荐:
随着全球人口老龄化,老年髋部骨折患者增多,再住院率上升给医疗系统带来巨大压力。研究人员开展基于机器学习的生存模型预测老年髋部骨折患者再住院风险的研究。结果显示不同模型各有优劣,该研究对优化医疗资源、改善患者预后意义重大。
在全球老龄化的浪潮下,老年髋部骨折逐渐成为一个棘手的医学难题。想象一下,老年人因髋部骨折入院治疗,本以为康复出院就能回归正常生活,可部分患者却不得不再次回到医院,这不仅让患者承受更多痛苦,也给医疗系统带来沉重负担。据了解,髋部骨折会大幅增加患者的发病率、死亡率以及再住院率。而且,随着老年人口数量的不断攀升,髋部骨折的发生率也在持续增长,这使得医疗资源愈发紧张。再住院不仅阻碍患者的康复进程,还对医疗系统的财务可持续性造成巨大压力 。因此,寻找能够精准预测老年髋部骨折患者再住院风险的方法迫在眉睫。
在这样的背景下,韩国 Daejeon Eulji Medical Center 的研究人员 Juhan Oh、Minah Park 等人挺身而出,开展了一项极具意义的研究。他们的研究成果发表在《BMC Musculoskeletal Disorders》上,为该领域带来了新的曙光。
为了深入探究这一问题,研究人员进行了一项回顾性队列研究。他们收集了 2020 年 1 月至 2022 年 6 月在 Daejeon Eulji Medical Center 住院的 718 例髋部骨折患者的详细资料,这些资料涵盖了患者的人口统计学信息、临床特征以及随访结果等多个方面。研究人员运用了 Cox 比例风险(CoxPH)、随机生存森林(RSF)、梯度提升(GB)和快速生存支持向量机(SVM)等多种机器学习模型,对这些数据进行了深入分析 。
研究人员首先对数据进行了一系列预处理操作。他们通过生成合成数据集来扩充数据量,同时利用 Kolmogorov-Smirnov(KS)检验和直方图重叠等方法评估合成数据的有效性。对于连续变量,如年龄、BMI 等,采用最小 - 最大缩放进行归一化处理;对于分类变量,像性别、骨折类型等,则运用标准缩放技术进行编码。
在模型开发阶段,研究人员将数据集随机分为训练集(80%)和测试集(20%) 。然后,他们运用多种机器学习模型来构建预测模型,并通过三折交叉验证和 50 次重复的超参数调整,以确保模型性能的可靠性并减少过拟合现象。
在模型选择和性能评估方面,研究人员依据多个性能指标来挑选最优模型,这些指标包括一致性指数(C-index)、曲线下面积(AUC)以及与 Kaplan-Meier(KM)生存曲线对比的预测生存曲线等。同时,他们还运用置换重要性来分析特征的重要性,从而确定影响再住院风险的关键因素。
研究结果令人眼前一亮。在超参数调整优化后,GB 模型展现出了卓越的性能,其平均 AUC 达到了 0.868,在所有模型中位居榜首,这表明 GB 模型在预测再住院风险方面具有较高的准确性;RSF 模型紧随其后,平均 AUC 为 0.785;SVM 模型的平均 AUC 为 0.763;CoxPH 模型的平均 AUC 相对较低,为 0.736 。
通过特征重要性分析,研究人员发现股骨颈 T 评分、年龄、BMI、手术时间、压缩骨折和总钙等因素是预测再住院风险的重要指标。其中,股骨颈 T 评分在多个模型中都被视为关键预测因素,低 T 评分往往意味着骨质疏松,这会增加术后并发症的发生风险,进而导致再住院率上升 。
在研究模型性能受特征选择的影响时,研究人员发现,特征选择对不同模型的影响各不相同。对于 RSF 模型和 CoxPH 模型来说,特征选择使得它们的 C-index 显著提高,这表明模型的预测性能得到了优化;然而,GB 模型和 SVM 模型在特征选择后,C-index 有所下降,这说明这两个模型对特征的全面性要求较高,去除部分特征会影响其性能 。
在对比不同模型的生存曲线时,研究人员发现 GB 模型和 RSF 模型预测的再住院概率比 KM 曲线估计的要低,其中 GB 模型在早期就与 KM 曲线出现了明显的分歧;而 CoxPH 模型的预测结果与 KM 曲线较为吻合,表现出更为保守和准确的特点 。
在对模型进行 12 个月再住院的二元分类评估时,所有模型都能准确识别出实际再住院的患者,即敏感性均为 1.00。但在特异性和精度方面,各模型存在差异。CoxPH 模型在这方面表现最佳,其特异性为 0.962,精度为 0.567,F1 分数也最高,达到了 0.723 。
综合来看,该研究表明虽然 GB 模型在预测再住院风险方面表现最佳,但还需要进一步的前瞻性验证。CoxPH 模型与 KM 生存曲线的契合度最高,这说明在不同的评估标准下,各个模型的表现各有优劣。这也凸显了在评估生存模型时,不能仅依赖单一指标,而应综合考虑多个指标的重要性。同时,研究还明确了股骨颈 T 评分、年龄、BMI 等因素在预测再住院风险中的重要作用。
从临床应用的角度来看,该研究成果意义非凡。在资源丰富、数据全面的大型医院,像 GB 这样的复杂模型能够充分利用多元信息,为患者制定个性化的护理方案,帮助医生识别那些可能从早期康复干预或药物优化中获益的患者;而在资源相对有限的小型骨科中心或早期分诊阶段,CoxPH 和 RSF 等简单模型则凭借其稳健性和可解释性,能够快速识别高风险患者,为临床决策提供有力支持 。
不过,这项研究也存在一些局限性。研究采用的是回顾性设计,这可能会因为数据收集的不一致和患者选择的偏差,影响研究结果的可靠性。数据缺失,尤其是股骨颈 T 评分等关键特征的缺失,不仅减少了样本量,还可能引入选择偏倚,限制了研究结果的普遍性。此外,合成数据在真实世界中的应用效果还有待进一步验证,而且研究仅在单一中心进行,缺乏外部队列的验证,这些都为后续研究指明了方向 。
尽管存在不足,但该研究首次在骨科手术领域展示了基于生存分析的机器学习模型的临床应用价值。它为预测髋部骨折患者的再住院风险提供了重要依据,也为后续研究奠定了坚实的方法学基础,有望推动机器学习在骨科领域的广泛应用,从而改善患者的治疗效果,优化医疗资源的分配。相信在未来,随着研究的不断深入,这些问题将逐步得到解决,为老年髋部骨折患者带来更多的希望。
研究人员在此次研究中,主要运用了以下几种关键技术方法:一是回顾性队列研究方法,收集 2020 年 1 月至 2022 年 6 月在韩国 Daejeon Eulji Medical Center 住院的髋部骨折患者数据;二是多种机器学习模型,包括 CoxPH、RSF、GB 和快速生存 SVM;三是数据预处理技术,如生成合成数据集、变量归一化和编码;四是模型评估指标,像 C-index、AUC 和 Kaplan-Meier 生存曲线等,以此全面评估模型性能。