使用可解释机器学习模型预测二叶式主动脉瓣患者升主动脉扩张及影响因素分析

《Cardiology Research and Practice》:Prediction of Ascending Aortic Dilation and Analysis of Influencing Factors in Bicuspid Aortic Valve Patients Using an Explainable Machine Learning Model

【字体: 时间:2026年06月14日 来源:Cardiology Research and Practice 1.8

编辑推荐:

  研究目标:开发机器学习(ML)模型以预测二叶式主动脉瓣(BAV)患者升主动脉扩张的风险,并应用SHapley Additive exPlanations(SHAP)对模型进行解释和可视化。研究方法:本研究纳入102例BAV患者,根据升主动脉直径分为扩张组与非扩

  
研究目标:开发机器学习(ML)模型以预测二叶式主动脉瓣(BAV)患者升主动脉扩张的风险,并应用SHapley Additive exPlanations(SHAP)对模型进行解释和可视化。研究方法:本研究纳入102例BAV患者,根据升主动脉直径分为扩张组与非扩张组。所有参与者接受常规超声心动图检查、临床基线数据采集及血浆基质金属蛋白酶(MMPs)及其组织抑制剂(TIMPs)的测定。采用单变量分析结合最小绝对收缩和选择算子(LASSO)–逻辑回归(LR)方法进行特征选择。构建了五种常见ML预测模型:支持向量机(SVM)、LR、梯度提升机(GBM)、神经网络(NNET)和朴素贝叶斯(NB)分类器。通过受试者工作特征曲线(ROC曲线)、校准曲线和决策曲线分析(DCA曲线)评估预测效能,以识别BAV患者升主动脉扩张的最佳预测模型。最后,应用SHAP解释最优模型的预测结果。研究结果:将全部患者随机分配为训练集(n=72)和测试集(n=30)。LASSO-LR分析显示,年龄、血浆MMP-2和主动脉瓣峰值流速(Vmax AV)是BAV患者升主动脉扩张的独立影响因素,并将这些预测因子纳入后续ML模型。经五折交叉验证后,GBM模型获得最佳整体性能,其在训练集的曲线下面积(AUC)为0.982,测试集AUC为0.915。校准曲线和DCA曲线进一步表明该模型具有良好的校准度和临床净获益。根据SHAP分析,血浆MMP-2升高对GBM模型预测的贡献最大,其次为年龄增加和Vmax AV升高。研究结论:GBM模型为预测BAV患者升主动脉扩张提供了有价值的工具。此外,SHAP分析通过提供清晰且可操作的临床管理见解,增强了模型的实用性。
**论文解读文章**

### 研究背景与问题
二叶式主动脉瓣(BAV)是最常见的先天性心血管疾病,在普通人群中患病率接近2%。BAV本质是一种进行性瓣膜-主动脉病变,超过半数患者发生升主动脉扩张。与普通人群相比,BAV患者主动脉夹层风险增加八倍,显著增高了总体死亡率。BAV主动脉病变的进展常无症状,其发病机制涉及遗传和血流动力学因素,导致目前缺乏针对性的预防和监测临床策略。临床实践中,超声心动图是首选成像手段,但主动脉直径仍是唯一的主动脉病变手术指征。然而,许多研究表明,即使主动脉直径未达到手术干预阈值,BAV患者仍可能发生主动脉夹层。因此,迫切需要开展前瞻性研究,探索与BAV主动脉病变相关的循环生物标志物,以早期识别主动脉壁结构变化。既往研究证实,基质金属蛋白酶(MMPs)活性增高及MMPs与其组织抑制剂(TIMPs)之间的失衡是BAV患者主动脉中膜层重塑受损的关键标志。近年来,机器学习(ML)算法在医学领域成功应用,可捕捉数据中复杂的非线性关系,但“黑箱”特性限制了临床推广。本研究整合循环生物标志物(血浆MMPs和TIMPs)、超声心动图参数和临床基线数据,识别危险因素并构建最优预测模型,同时应用SHapley Additive exPlanations(SHAP)分析提高可解释性,旨在建立临床适用工具,为BAV主动脉病变决策提供科学依据。该论文发表在《Cardiology Research and Practice》。

### 主要关键技术与方法
研究人员从宁夏医科大学总医院连续纳入102例BAV患者,依据升主动脉直径分为扩张组(>35 mm,n=53)与非扩张组(≤35 mm,n=49)。所有参与者行经胸超声心动图(TTE)测量左心室射血分数(LVEF)、主动脉瓣峰值流速(Vmax AV)等参数。采用酶联免疫吸附试验(ELISA)测定血浆MMP-1、MMP-2、MMP-3、MMP-9及TIMP-1、TIMP-2、TIMP-3、TIMP-4水平并计算比值。采用单变量分析筛选变量后,运用最小绝对收缩和选择算子(LASSO)回归结合逻辑回归(LR)进行特征选择。构建五种ML模型:支持向量机(SVM)、LR、梯度提升机(GBM)、神经网络(NNET)和朴素贝叶斯(NB)。通过五折交叉验证、受试者工作特征曲线(ROC曲线)、校准曲线和决策曲线分析(DCA曲线)评估模型性能,并应用SHAP解释最优模型。

### 研究结果
#### 3.1 基线特征
单变量分析显示,扩张组患者年龄显著大于非扩张组(p<0.001),其他临床参数组间无显著差异。

#### 3.2 超声心动图参数
扩张组Vmax AV、平均压差(MPG)、升主动脉直径及升主动脉直径指数均显著高于非扩张组(均p<0.001);左心室射血分数(LVEF)、左心室质量指数(LVMI)、E/A比值、平均E/e′、左房容积指数(LAVI)及瓣膜表型组间差异无统计学意义。

#### 3.3 血浆MMPs、TIMPs及MMP/TIMP比值
扩张组血浆MMP-2、MMP-3、MMP-9、TIMP-1、TIMP-2水平显著升高,且MMP-2/TIMP-1、MMP-2/TIMP-2、MMP-2/TIMP-3、MMP-2/TIMP-4、MMP-3/TIMP-3及MMP-9/TIMP-3比值均显著增高(均p<0.05)。

#### 3.4 升主动脉扩张的影响因素
LASSO回归筛选后,多变量逻辑回归显示年龄、Vmax AV和血浆MMP-2是BAV患者升主动脉扩张的独立影响因素(p<0.05)。

#### 3.5 预测模型开发与比较
基于三个独立因子构建五种ML模型。GBM模型在训练集AUC=0.982,测试集AUC=0.915,校准曲线与理想曲线吻合良好(Hosmer-Lemeshow检验p>0.05),DCA曲线显示较宽的临床净获益阈值范围(训练集0.02~0.98,测试集0.15~0.98)。综合判别能力、校准度及临床净获益,GBM模型被确定为最优预测模型。

#### 3.6 基于GBM的模型解释与风险分层
SHAP分析显示,血浆MMP-2(平均SHAP值=0.253)是最强预测因子,其次为年龄(0.160)和Vmax AV(0.107)。依赖性图提示:年龄>36岁、Vmax AV>1.26 m/s、血浆MMP-2>112.65 ng/mL时,模型预测风险显著增加。研究人员提出初步风险分层:低风险(无高危特征)、中风险(任意两个高危特征组合)、高风险(同时具备三个高危特征)。

### 讨论与结论
讨论部分指出,BAV患者升主动脉扩张的发现常为偶然,诊断延迟导致主动脉夹层风险升高。既往ML模型多基于单模态数据,本研究首次整合循环生物标志物、超声心动图参数和临床数据。与传统LR相比,GBM模型能捕捉变量间复杂非线性关系,SHAP分析增强了可解释性。年龄增加导致主动脉硬化,Vmax AV升高反映血流动力学异常,MMP-2通过降解主动脉壁中膜弹力蛋白和胶原直接参与血管重塑。局限性包括:样本量较小且来自单中心,训练集AUC高于测试集提示可能存在过拟合风险,未来需多中心外部验证。

研究结论:年龄、Vmax AV和血浆MMP-2是BAV患者升主动脉扩张的独立危险因素;GBM模型可作为最优预测工具;结合SHAP分析成功解决“黑箱”问题,增强了模型的可解释性和临床实用性,为临床医生评估BAV主动脉病变进展和预后提供了科学依据,支持早期干预和个体化管理。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号