基于机器学习的分析方法,探讨影响A型主动脉夹层手术时长的相关因素
《Frontiers in Public Health》:Machine learning-based analysis of factors influencing surgical duration in type A aortic dissection
【字体:
大
中
小
】
时间:2025年11月01日
来源:Frontiers in Public Health 3.4
编辑推荐:
TAAD手术时间预测与关键影响因素分析。本研究构建11种机器学习模型,基于47项术前及术中特征,验证ExtraTrees模型预测最优(R2=0.71),SHAP分析显示体外循环时间、主动脉阻断时长、术中输血、升主动脉及根部手术方式为五大关键预测因子,环境因素无显著影响。
### 研究背景与意义
Stanford Type A aortic dissection(TAAD)是一种严重威胁生命的疾病,主要影响升主动脉,通常需要紧急手术干预。由于其复杂的病理机制和高风险性,TAAD的手术不仅技术难度大,而且对患者的生理状态和手术团队的处理能力提出了更高的要求。手术时间是影响患者术后恢复和手术风险的重要因素,而精准预测手术时长对于优化医疗资源配置、提升手术安全性以及改善患者预后具有重要意义。然而,目前在临床实践中,手术时长的预测仍面临诸多挑战,主要依赖于外科医生的经验和历史数据,缺乏系统的分析方法和精确的预测模型。
随着机器学习技术在医学领域的广泛应用,越来越多的研究开始尝试将其应用于手术时间的预测与分析。本研究正是在这一背景下展开,旨在通过构建11种机器学习回归模型,全面分析TAAD手术中影响手术时长的关键临床因素。研究不仅关注手术前和手术中的变量,还引入了环境因素,如气温、湿度、空气质量指数(AQI)等,以探索外部环境是否对手术时长产生影响。通过这一综合分析,研究希望为临床医生提供更精准的预测工具,从而在术前更好地评估手术风险、优化资源配置,并在术中提高操作效率。
### 研究方法与数据来源
本研究是一项回顾性队列研究,数据来源于青岛大学附属医院,涵盖2017年12月至2023年3月期间接受TAAD手术的675名患者。在数据清洗过程中,排除了74名非TAAD患者、93名未接受手术的患者以及3名数据缺失超过50%的患者,最终纳入505名患者进行分析。数据包括患者的基本信息、术前及术中指标、实验室检查结果以及环境变量等。所有数据均通过标准化处理和多重插补法进行预处理,以确保模型训练的准确性和稳定性。
研究采用了多种机器学习回归模型,包括线性回归、弹性网络、决策树回归、随机森林回归、ExtraTrees回归、梯度提升回归、XGBoost、CatBoost、AdaBoost、支持向量回归(SVR)和K近邻(KNN)回归。这些模型的性能通过R2、均方根误差(RMSE)和平均绝对误差(MAE)进行评估,并通过五折交叉验证进一步验证模型的泛化能力。此外,研究还引入了SHAP(SHapley Additive exPlanations)分析方法,以增强模型的可解释性,识别对手术时长影响最大的临床特征。
### 研究结果与分析
#### 患者的基本特征
研究纳入的505名患者中,男性占73.4%,女性占26.6%,平均年龄为54.0岁,标准差为12.6。术前的生理指标显示,患者平均心率80.9次/分钟,平均收缩压134.4 mmHg,平均舒张压69.0 mmHg,平均体温36.5°C。在病史方面,高血压、心血管疾病和糖尿病的患病率分别为61.1%、93.4%和98.0%,表明患者普遍存在慢性基础疾病。实验室检查结果显示,患者的炎症反应普遍升高,白细胞计数平均为12.0×10?/L,C反应蛋白平均为38.6 mg/L,D-二聚体平均为6752.0 μg/L FEU,提示患者术前处于高度的炎症和凝血状态。
术前准备时间平均为0.8天,术前ICU停留时间平均为0.6天,表明大部分患者为急诊手术。此外,研究还考虑了气候因素,包括环境温度、湿度、PM2.5和AQI等,以评估外部环境是否对手术时长产生影响。然而,气候因素并未显示出显著的关联性,这表明手术时长主要受术中操作和患者病理状态的影响。
#### 手术策略与手术时长
在手术策略方面,研究发现不同手术方式对手术时长有显著影响。其中,升主动脉根部修复(Valve-sparing aortic root replacement)和升主动脉替换(Ascending aortic replacement)手术时间相对较短,平均为438.9分钟和436.9分钟。而涉及全弓替换(Total arch replacement)的手术则显著延长了手术时间,平均为459.2分钟。全弓替换中,使用冷冻象鼻(FET)技术的手术时间进一步延长,平均为465.7分钟,而非FET技术的手术时间则相对较少,平均为403.5分钟。此外,部分弓替换(Partial arch replacement)的手术时间比全弓替换短,但仍然需要深低温停循环(deep hypothermic circulatory arrest)以维持手术安全。而仅涉及主动脉分支的术式(Debranching)则不需要深低温停循环,因此手术时间更短。
研究还发现,手术时长与主动脉阻断时间呈显著正相关(r = 0.64, p < 0.01),表明在复杂的手术过程中,主动脉阻断时间的延长是手术时长增加的重要因素之一。这一结果与临床经验一致,因为主动脉阻断期间,心脏和大脑的灌注管理对患者的安全至关重要,而这一过程往往需要更多时间。
#### 机器学习模型的预测性能
在所有构建的模型中,ExtraTrees Regressor表现最佳,其R2值达到0.7101,表明该模型能够解释约71.01%的手术时长变化。其平均绝对误差(MAE)为43.54分钟,均方根误差(RMSE)为59.42分钟,均低于其他模型。相比之下,传统的线性回归模型(R2 = -1.1302)和SVR(R2 = -0.3017)表现较差,这表明线性模型在处理复杂、非线性关系时存在明显局限。KNN模型同样表现不佳,其对高维数据和异常值较为敏感,容易受到数据分布和特征尺度的影响。
此外,ExtraTrees模型在验证集上的表现也优于其他模型,R2值为0.7574,MAE为46.19分钟,RMSE为58.60分钟。这一结果进一步验证了ExtraTrees在处理高维、非线性数据时的优势,其通过随机划分特征和阈值,降低了模型的方差,提高了泛化能力。同时,模型的残差分布接近正态分布,且预测曲线能够很好地跟随实际手术时长的变化趋势,显示出良好的稳定性。
#### 特征重要性分析
通过SHAP分析,研究确定了五个对手术时长影响最大的临床特征:体外循环时间、主动脉阻断时间、术中输血量、主动脉弓处理方式和主动脉根部处理方式。其中,体外循环时间对模型输出的贡献最大,表明其是手术时长的关键决定因素之一。主动脉阻断时间次之,这与手术中需要更长时间进行心脏保护和止血有关。术中输血量的影响则呈现出明显的非线性特征,当输血量较低时,其对手术时长的影响较小,而当输血量较高时,其贡献显著增加,反映出术中出血量与手术复杂度之间的关系。
主动脉弓和根部的处理方式对手术时长的影响同样显著,其中全弓替换和复杂的根部修复(如Bentall和复合根部替换)与较长的手术时间相关。这表明,手术方式的选择直接影响手术的复杂程度和耗时。值得注意的是,尽管Marfan综合征并未被列为影响手术时长的前五因素,但其作为遗传性主动脉疾病的一部分,对手术复杂性的潜在影响仍值得进一步探讨。
### 研究讨论与意义
#### 与传统方法的比较
传统的手术时长预测方法主要依赖于线性回归模型和医生经验。然而,这些方法在处理复杂、非线性数据时存在局限,无法充分捕捉手术过程中多因素之间的相互作用。例如,线性回归模型假设变量之间存在线性关系,而实际手术时长往往受到多个非线性因素的共同影响。此外,医生经验受到个体差异和主观判断的影响,导致预测结果存在较大的偏差。
相比之下,机器学习模型能够处理高维、非线性数据,并通过学习数据中的复杂模式,提高预测的准确性。本研究中,ExtraTrees模型在预测性能上显著优于传统模型,表明其在处理TAAD手术时长预测任务中的优势。此外,其他集成学习模型(如XGBoost和CatBoost)也表现出良好的性能,但其在残差分布和趋势拟合方面略逊于ExtraTrees,说明ExtraTrees在处理临床数据时的鲁棒性更强。
#### 手术策略对时长的影响
研究发现,手术策略是影响手术时长的重要因素。例如,全弓替换和复杂的根部修复通常需要更长的手术时间,这与手术的复杂性和操作难度密切相关。而无需深低温停循环的术式(如Debranching)则显著缩短了手术时长,这表明手术策略的选择对患者术中管理和手术时间有直接关系。此外,术中输血量与手术时长呈非线性关系,当输血量较高时,手术时间明显延长,这反映了术中出血对操作复杂度和时间的影响。
研究还指出,主动脉阻断时间的延长不仅与手术操作本身有关,还与术中止血和心脏保护的需求相关。较长的阻断时间通常意味着更复杂的操作流程,这可能增加术中并发症的风险。因此,优化手术策略、减少不必要的操作步骤和提高止血效率,对于缩短手术时长和降低术后风险具有重要意义。
#### 模型性能分析
在本研究中,ExtraTrees模型表现出卓越的预测性能,这与其采用的随机划分策略密切相关。通过随机选择特征和阈值,该模型能够有效降低方差,提高泛化能力。此外,模型在训练和验证集上的表现高度一致,表明其具有良好的稳定性和适应性。相比之下,传统的线性模型和SVR在处理高维、非线性数据时存在明显不足,容易出现过拟合或欠拟合的问题。KNN模型则由于对异常值和特征尺度敏感,难以在高维数据中保持良好的预测能力。
研究还指出,模型的残差分布接近正态分布,且预测曲线能够很好地跟随实际手术时长的变化趋势,表明模型在处理临床数据时具有较强的适应性和稳定性。这一结果为临床医生提供了可靠的预测工具,有助于术前评估手术风险、优化资源配置,并在术中提高操作效率。
#### 临床意义与局限性
本研究的临床意义在于,通过机器学习模型,能够更准确地预测TAAD手术时长,为术前规划和术中管理提供重要参考。研究识别出的五个关键因素(体外循环时间、主动脉阻断时间、术中输血量、主动脉弓处理方式和主动脉根部处理方式)为临床医生提供了明确的指导,有助于在手术前制定更合理的计划,并在术中采取更有效的措施。
然而,研究也存在一定的局限性。首先,数据主要来源于单一中心,样本量相对有限,可能影响模型在外部数据集中的泛化能力。其次,部分关键特征(如术中输血量和主动脉阻断时间)仅在术中获取,这限制了模型在术前预测中的应用。此外,研究未进行外部验证,这可能影响结果的普遍适用性。未来的研究可以考虑采用多中心、前瞻性设计,以进一步验证模型的预测性能,并探索更丰富的术前数据,以提高预测的准确性和实用性。
### 研究结论与展望
本研究构建了11种机器学习回归模型,用于预测和分析TAAD手术时长。其中,ExtraTrees模型在预测性能上表现最佳,能够有效解释手术时长的变化。研究还发现,手术策略、术中操作和患者病理状态是影响手术时长的主要因素,其中体外循环时间、主动脉阻断时间、术中输血量、主动脉弓和根部处理方式对手术时长的影响最为显著。这些结果为临床医生提供了重要的参考,有助于优化手术策略、提高手术效率,并减少术后并发症的风险。
尽管本研究在预测模型的构建和分析方面取得了重要进展,但仍需进一步探索多中心、前瞻性数据,以验证模型的普遍适用性。此外,未来的研究可以考虑引入更多的术前变量,以提高模型的预测能力。随着机器学习技术的不断发展,其在医疗领域的应用前景广阔,有望为手术时间预测、术前风险评估和术后管理提供更加精准和高效的解决方案。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号