人工智能驱动的多变量整合:肺动脉高压中肺动脉压力的可解释预测新方法
《npj Digital Medicine》:Artificial intelligence-driven multivariate integration for pulmonary arterial pressure prediction in pulmonary hypertension
【字体:
大
中
小
】
时间:2025年12月19日
来源:npj Digital Medicine 15.1
编辑推荐:
本研究针对肺动脉高压(PH)有创诊断的临床困境,创新性地融合心脏磁共振(CMR)4D血流成像与机器学习技术,开发了基于XGBoost和符号回归(SISSO)的肺动脉平均压(mPAP)无创预测模型。该模型仅需8个关键特征(如RVWT、BMI等),即能实现高精度预测(R2=0.92),并对非PAH亚组保持良好泛化能力。研究首次构建了CMR驱动的血流动力学增强框架,为PH的精准诊断和风险分层提供了可解释的AI工具,有望降低对右心导管术(RHC)的依赖。
在心血管疾病领域,肺动脉高压(Pulmonary Hypertension, PH)如同一座沉默的火山,影响着全球约1%的人口。这种以肺动脉平均压(mean Pulmonary Arterial Pressure, mPAP)升高为特征的进行性疾病,显著增加右心室负荷,最终可能导致右心衰竭甚至死亡。目前,右心导管术(Right Heart Catheterization, RHC)仍是诊断PH的"金标准",但这种有创检查不仅需要专业医师操作,还伴随感染、过敏反应和麻醉并发症等风险,极大限制了其临床应用。
临床医生们通常采用超声心动图进行PH的早期识别和随访,但遗憾的是,基于三尖瓣反流速度(Tricuspid Regurgitation Velocity, TRV)的mPAP估计值与RHC测量值的一致性不足60%。这主要是由于操作者间的变异性和图像质量不理想所致。相比之下,心脏磁共振(Cardiac Magnetic Resonance, CMR)能够提供准确、可重复的成像结果和可靠的右心室评估。特别是通过时间分辨、三方向MR相位对比(4D-flow)成像量化肺动脉血流,在大规模研究中显示对检测mPAP升高的准确率超过90%。
随着人工智能理论的进步,基于学习的PH诊断方法已成为一个有前景的方向。然而,现有的分类方法在识别临界患者(mPAP在18-20 mmHg之间)和支持临床风险分层方面存在固有不足,因为这两项任务都需要对mPAP的连续变化有更细致的理解。捕捉这种微妙动态需要准确的回归建模——这在真实临床环境中仍然极具挑战性。
针对这一挑战,武汉大学中南医院结构心脏病中心曾宇轩、凌恭昊、张浩杰等研究人员在《npj Digital Medicine》上发表了一项创新研究,提出了一种结合集成学习、符号回归和敏感性分析的有效评估框架。该框架利用一系列无创可测特征(如生命体征、CMR数据和人口统计学特征)定量学习mPAP,为PH的临床决策支持和预后评估提供了新见解。
本研究为回顾性观察性临床研究,纳入了2022年1月至2025年7月期间接受RHC的120例患者(最终队列)。所有患者均接受3T CMR扫描,包括标准cine平衡稳态自由进动序列和自由呼吸下的4D-flow CMR数据采集。研究采用互信息进行特征筛选,使用XGBoost进行高精度预测,并应用SISSO算法构建可解释的符号回归模型。通过Sobol指数、SHAP和LIME等多种敏感性分析方法系统量化各特征对mPAP值的影响。
研究共纳入120例患者,其中非PH患者明显较年轻(23岁 vs. 38岁,p<0.001)。大多数PH患者被分类为第1组(肺动脉高压,n=64,83.1%),还包括1例慢性阻塞性肺疾病所致PH(第3组)、11例慢性血栓栓塞性肺动脉高压(第4组)和1例纤维化纵隔炎所致PH(第5组)。因数据不完整,本研究未纳入左心疾病所致PH(第2组)患者。
研究人员首先采用极致梯度提升(XGBoost)模型,该模型非常适合表格数据集且易于实现。在初始训练中,训练数据集纳入了基本人口统计学特征、实验室生物标志物和血流动力学参数。为确保模型性能可靠客观,采用10折交叉验证评估XGBoost。在此设置下,R2值为0.992,平均绝对百分比误差低至4.49%,共同证明了模型的卓越预测保真度。
值得注意的是,当排除所有超声心动图衍生变量后,模型性能反而略有改善。尽管排除了七个超声心动图特征降低了输入维度,但仍保留了168个变量(包括CMR衍生指标)。研究人员采用互信息评估并实现特征降维,发现仅需6个特征即可使R2超过0.90。当保留特征数达到8个时,R2峰值达0.97。基于医学先验知识,研究人员手动将RWMaxWSS和LWMaxWSS分别替换为BMI和UA,意外地发现这种调整显著改善了模型性能。
为构建完全可解释的mPAP符号模型,研究采用确信独立筛选和稀疏算子(SISSO)方法。该方法通过组合一个或多个主要特征与运算符来构建新变量(称为"描述符"),捕获特征间的非线性关系。最终得到的符号模型平均绝对百分比误差为17.01%,R2为0.9239,显著优于传统经验公式mPAP=0.61×RVSP+2。
与传统依赖超声心动图特征的经验公式不同,SISSO衍生的符号模型整合了更客观、全面的指标,如CMR和人口统计学特征,从而提供了更可靠的预测方法。该模型首次实现了仅基于实验室生物标志物和CMR产生的血流动力学参数对mPAP的定量估计。
虽然符号模型增强了决策过程的透明度,但特征重要性的定量识别仍需要敏感性分析。研究采用Sobol指数、SHAP指数和LIME指数实现这一目的。有趣的是,尽管RVWT在互信息中排名最高,并在各种敏感性分析方法中反复被确定为最关键特征,但其对mPAP的实际影响似乎有限。相比之下,RWMaxWSS表现出明显更强的主导影响。
跨图6中整个x4列,无论与哪个其他变量相互作用,都观察到x4与Ex(P|...)之间存在一致的负相关。具体来说,每个子图的左侧区域(对应较低的x4值)一致以红色突出显示,表明预测的mPAP较高,因此存在PH亚型。相反,右侧区域显示主要绿色区域,与较低的mPAP值相关,并且主要由非PH个体占据。
符号模型的诊断性能表现优异,受试者工作特征曲线下面积(AUC)为0.987(95%置信区间:0.975-0.997)。该模型对PH总体诊断的敏感性和特异性分别为0.935和0.953。由于模型是在以PAH为主要研究对象的群体上开发的,研究人员担心其在其他亚组中可能准确性不足。然而,在13例非PAH患者中的验证表明,模型预测的mPAP与RHC测量的mPAP之间仍然存在良好一致性(R2=0.825,p=8.6×10-6)。
除了mPAP,通过RHC评估的重要血流动力学参数还包括肺血管阻力(PVR)和肺动脉楔压(PAWP)。为开发PH的非侵入性评估方法,研究人员进一步使用上述8个参数构建了PVR和PAWP的预测模型。预测的PVR与实际PVR显示出强相关性(R2=0.9111,p=7.5×10-64)。然而,预测的PAWP与RHC测量的PAWP之间的一致性低于mPAP和PVR(R2=0.7535,p=1.1×10-37)。
本研究成功开发了基于CMR、人工智能驱动的多变量模型,用于预测PH患者的mPAP。该模型验证了将CMR衍生参数整合到AI框架中以支持PH管理的可行性。在RHC不可用或不可行的情况下,它可能作为一种潜在的非侵入性替代方案。
研究发现,在多元模型中,RVWT、BMI、RVEDV/BSA、RWMaxWSS、RPAvgWSS、LPBV、LPNPV和UA被确定为mPAP的关键预测因子。相比之下,NT-proBNP和6MWD等传统指标显示出较弱的相关性。值得注意的是,PH患者中较低的BMI显示较差的治疗反应,研究观察到BMI与mPAP之间存在强相关性。一个合理的解释是,mPAP升高导致右心衰竭,引起胃肠道充血和消化功能受损,最终降低BMI——这种模式在晚期疾病中尤为明显。据我们所知,这是首次强调PH患者BMI变化作为及时评估疾病进展的潜在指标的研究。
尽管研究存在某些局限性(如小样本量、排除第2组患者等),但提出的方法提供了一个可转移的框架,不仅限于PH。可解释AI的价值在于从数据中揭示潜在模式,为医学理论提供信息并完善之。这种方法可以应用于其他疾病的建模,为医学研究提供新的见解。
未来研究应侧重于纳入更多的血流动力学指标和简化工作流程,以实现更广泛的临床采用。同时,需要在更大、更具代表性的包含所有PH亚组的队列中进一步验证模型的可靠性和临床适用性,并进行外部、前瞻性和多中心验证以确认普适性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号