编辑推荐:
为预测髋膝关节置换(HA/KA)手术时长(DOS),研究人员对比 XGBoost 和线性回归,发现机器学习预测性能尚可,有重要意义。
在医疗领域,髋膝关节置换(HA/KA)手术是治疗关节疾病的重要手段。然而,手术时长(DOS)却如同一个捉摸不定的 “变量”,给医疗工作带来诸多挑战。手术时间过长,会增加患者术后出现如翻修、再入院、感染、肾功能损害等不良事件的风险 ;而手术时间预估不准确,也会导致医院手术室(OR)排班效率低下,影响医疗资源的合理分配。以往的数据驱动的 DOS 规划在骨科诊所中很少实施,虽然有研究尝试用机器学习(ML)预测手术时长,但存在预测不够精准、对实际手术排班意义有限等问题。为了突破这些困境,来自德国的研究人员开展了一项极具意义的研究,该研究成果发表在《BMC Medical Informatics and Decision Making》上。
研究人员为实现精准预测 DOS,优化 OR 资源规划,提升患者安全,采用了 XGBoost 这一先进的机器学习算法和线性多变量回归作为对比模型进行研究。研究数据来源于 PROMoting Quality 研究,这是一项多中心、单盲随机对照试验,涵盖了德国九家医院 2019 - 2021 年接受 HA 或 KA 手术的患者数据。经过数据清洗和预处理,最终多医院数据集包含 3704 名患者,单医院数据集(“Hospital nr. 8”)包含 1815 名患者。
研究中运用的关键技术方法主要有:首先,采用随机森林插补法处理缺失数据;其次,将所有可能影响手术时长的术前变量纳入模型,包括社会人口学信息、关节手术史、术前诊断、行为变量、患者报告结局指标(PROMs)等,并对分类变量进行独热编码;然后,运用 XGBoost 和线性多变量回归进行预测建模,通过 5 折交叉验证(CV)和随机搜索对 XGBoost 模型进行超参数调优;最后,使用平均绝对误差(MAE)、均方根误差(RMSE)和平均绝对百分比误差(MAPE)等指标评估模型性能,并利用 SHapley Additive exPlanation(SHAP)分析确定重要预测变量。
研究结果如下:
- 多医院分析:在训练数据上,XGBoost 模型在 HA 样本中的 MAE 为 12.60min,KA 样本中为 13.21min;线性多变量回归模型性能略逊一筹,但二者置信区间重叠。在测试数据上,XGBoost 模型在 HA 样本中的 MAE 为 12.13min,KA 样本中为 13.61min;线性多变量回归模型在测试数据上性能稍有提升,但 XGBoost 模型点估计表现仍更好,二者置信区间依旧重叠。特征重要性分析表明,“Hospital nr. 8” 进行的手术对降低 DOS 影响显著,主刀医生手术量、是否有主任医师参与、专科医生数量、患者 BMI 和体重等因素也与 DOS 相关。
- 单医院深入分析:“Hospital nr. 8” 中 HA 患者平均 DOS 为 46.1min,KA 患者为 52.6min。在训练数据上,XGBoost 模型性能明显优于线性多变量回归模型;在测试数据上,所有模型性能均有所下降,但 XGBoost 模型在 HA 和 KA 样本中的 MAE 仍分别低于线性多变量回归模型,不过此时二者置信区间重叠。特征重要性方面,手术量成为最重要的预测因素,此外,患者年龄、PROMs、疼痛程度等因素也与 DOS 相关。
研究结论和讨论部分指出,该研究首次以连续结果预测 DOS,具有较高的实际应用价值。机器学习模型在多医院和单医院场景下均能合理预测 DOS,虽然 XGBoost 总体表现稍好,但与线性多变量回归模型在统计上无显著差异。研究还发现,外科医生经验、患者年龄、BMI 等是 DOS 的重要预测因素,PROMs 可作为相关特征,医院因素在多医院分析中影响显著,这可能反映出医院之间的质量差异。然而,该研究也存在局限性,如数据集相对较小、包含一些不常规收集的变量、未验证预测性能对 OR 效率和患者安全的实际影响、未明确 DOS 定义是否最佳、无法确定因果关系等。未来需更大数据集、纳入更多信息进行研究,同时开展试点项目验证模型效果。
总的来说,这项研究为髋膝关节置换手术时长预测提供了新的思路和方法,对优化手术室资源规划、保障患者安全具有重要的指导意义,也为后续相关研究奠定了基础。