通过可解释的人工智能揭示银屑病中心血管风险的关键生物标志物 Hasan Ucuzal 和 Mehmet K?vrak

《Biology》:Unveiling Key Biomarkers of Cardiovascular Risk in Psoriasis Through Explainable Artificial Intelligence Hasan Ucuzal and Mehmet K?vrak

【字体: 时间:2026年03月27日 来源:Biology 3.5

编辑推荐:

  三、摘要翻译 银屑病患者面临显著升高的心血管疾病(CVD)风险,然而标准临床工具难以实现早期识别。研究人员利用2685例银屑病患者的数据,在严格的防泄漏框架内训练并验证了六种机器学习模型。CatBoost取得了最佳性能(ROC-AUC=0.908,Brier=

  
三、摘要翻译 银屑病患者面临显著升高的心血管疾病(CVD)风险,然而标准临床工具难以实现早期识别。研究人员利用2685例银屑病患者的数据,在严格的防泄漏框架内训练并验证了六种机器学习模型。CatBoost取得了最佳性能(ROC-AUC=0.908,Brier=0.078),并识别出包括年龄、血压和炎症标志物在内的21个关键预测因子。可解释人工智能方法(SHAP、LIME、Anchors)提供了透明的、患者层面的风险解释。本研究证明,使用常规临床数据的可解释机器学习可支持银屑病患者CVD风险分层,但需外部验证。

四、论文解读

研究背景与意义

银屑病是一种以遗传易感性为基础、免疫介导的慢性皮肤病,全球患病率约2%,常伴随代谢综合征、抑郁症及心血管疾病(CVD)等共病。CVD是银屑病患者的主要死亡原因之一,其发病隐匿、症状异质性高,传统临床工具难以实现早期精准风险分层。近年来,机器学习算法在医疗决策支持中的应用日益广泛,但针对银屑病患者的CVD风险预测模型仍存在数据泄漏风险高、可解释性不足等问题。为此,研究人员开展了基于可解释人工智能的银屑病CVD风险预测研究,旨在开发兼具高精度与透明性的风险评估工具,相关成果发表于《Biology》。

关键技术方法

研究纳入首都医科大学附属北京中医医院2009年1月至2024年9月的2685例银屑病患者数据,经年龄、肿瘤及数据完整性筛选后,最终纳入2416例受试者(CVD阳性225例,阴性2191例)。采用局部离群因子(LOF)算法去除异常值,通过Boruta算法进行特征选择,合成少数类过采样技术(SMOTE-NC)处理类别不平衡。构建六种机器学习模型(逻辑回归基线及XGBoost、LightGBM、CatBoost等五种集成算法),采用嵌套交叉验证框架(外层10折、内层3折)优化超参数,结合SHAP、LIME、Anchors等方法实现模型可解释性分析。

研究结果

1. 相关性分析
Pearson相关矩阵显示,CVD与代谢指标(糖尿病r=0.32、空腹血糖r=0.27)、血管风险因素(高血压r=0.35、年龄r=0.32)呈显著正相关;补体C1q(r=-0.08)、白蛋白(ALB,r=-0.08)等与CVD呈弱负相关。血小板计数(PLT)与血小板压积(PLT_PCT)强正相关(r=0.85),提示共线特征需进一步筛选。
2. 模型性能
六种模型中,逻辑回归基线ROC-AUC达0.909,但因校准差(Brier=0.114>0.10)被排除。CatBoost表现最优:OOF ROC-AUC=0.908(95%CI[0.892–0.924]),PR-AUC=0.509(95%CI[0.448–0.578]),Brier=0.078,F1=0.540,MCC=0.498。LightGBM校准最佳(Brier=0.076),AdaBoost校准最差(Brier=0.145)。
3. 可解释性分析
SHAP全局重要性显示,年龄(mean|SHAP|≈1.42)、高血压(≈0.70)、空腹血糖(FBG,≈0.70)、血脂异常(≈0.65)及γ-谷氨酰转移酶(GGT,≈0.45)为前五位预测因子。局部解释(五例代表性患者)表明,高风险患者特征贡献以血脂异常(Dyslipidemia>0.00,+0.203)、FBG>6.39(+0.167)为主。PDP/ICE曲线显示,FBG(拐点~6–7 mmol/L)、年龄(拐点~55–60岁)、收缩压(SBP,拐点~150 mmHg)与CVD风险呈单调正相关;补体C1q(拐点~130–140 mg/dL)、载脂蛋白E(apoE,拐点~30–35 mg/dL)与风险呈负相关。Anchors规则对高风险患者的解释为“年龄≤43.00且血脂异常≤0.00”(精度0.979,覆盖率0.241)。

讨论与结论

研究通过严格防泄漏框架开发的CatBoost模型,在银屑病CVD风险预测中表现出优异的判别能力与校准性能,其优势在于概率校准(Brier=0.078)与少数类检测(PR-AUC=0.509),而非单纯提升判别度(ΔROC≈-0.001)。关键预测因子涵盖代谢、血管及炎症指标,提示银屑病“炎症-代谢-心血管损伤”的病理关联。补体C1q与apoE的负相关关联需实验验证其潜在保护机制。局限性包括单中心回顾性设计、缺乏外部验证及未纳入影像学指标。未来需开展多中心前瞻性研究,整合多组学数据以提升模型泛化性。
结论:本研究通过可解释机器学习构建了银屑病CVD风险预测模型,CatBoost为最优算法,识别出21个关键生物标志物,为临床风险分层提供了透明化工具,但需外部验证后方可转化应用。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号