
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于Klotho蛋白水平的机器学习模型预测冠心病风险:一项NHANES大数据研究
【字体: 大 中 小 】 时间:2025年05月28日 来源:Scientific Reports 3.8
编辑推荐:
本研究针对冠心病(CHD)诊断准确性不足的临床难题,创新性地结合Klotho蛋白这一新型生物标志物与机器学习(ML)技术,利用NHANES 2007-2016年11,583例人群数据构建预测模型。研究通过LASSO回归筛选13项临床特征,比较逻辑回归(LR)、随机森林(RF)等5种算法性能,最终确立RF模型(AUC=0.7394,Brier评分0.0866)为最优预测工具,证实Klotho是仅次于年龄的关键预测因子。该研究为CHD早期筛查提供了可解释性强的新型AI工具,具有重要转化价值。
冠心病预测的新突破:Klotho蛋白遇上机器学习
在全球心血管疾病负担日益加重的背景下,冠心病的早期诊断始终面临巨大挑战。传统风险因素如高血压、糖尿病虽已被广泛认知,但仍有约20%的冠心病患者缺乏典型危险因素。近年来,一种名为Klotho的"抗衰老蛋白"逐渐进入研究者视野——动物实验显示它能抑制血管钙化和氧化应激,但人类流行病学证据仍存空白。更棘手的是,常规统计方法难以处理Klotho与多种代谢通路间的复杂交互作用。
山西医科大学汾阳学院联合汾阳医院心血管内科的研究团队另辟蹊径,将人工智能技术与临床医学深度融合。他们挖掘美国国家健康与营养调查(NHANES)十年数据,首次系统评估了Klotho蛋白在冠心病预测中的价值。这项发表于《Scientific Reports》的研究不仅证实Klotho是独立于传统因素的新生物标志物,更开创性地构建了可解释性强的临床预测工具。
研究采用横断面设计,通过5种机器学习算法处理11,583名40岁以上成年人的多维数据。关键技术包括:1) LASSO回归筛选13项核心预测变量;2) SMOTE算法处理样本不平衡问题;3) 限制性立方样条(RCS)解析Klotho与CHD的非线性关系;4) SHAP值解释随机森林模型的决策逻辑。
研究结果
人群特征分析
数据显示CHD组(n=1074)与非CHD组(n=10,509)存在显著差异:患者平均年龄更高(65 vs 57岁)、男性占比更高(63.59% vs 47.55%),且肥胖(51.86% vs 41.07%)、糖尿病(44.97% vs 21.69%)等合并症更普遍。值得注意的是,CHD组血清Klotho中位数显著降低(773.1 vs 805.2 pg/mL)。
模型性能比较
支持向量机(SVM)虽取得最高AUC值(0.7841),但其召回率(0.6942)和F1值(0.8091)表现欠佳。随机森林(RF)在综合评估中脱颖而出:Brier评分0.0866表明预测误差极小,且保持较高准确率(0.8938)。特别重要的是,RF模型对"假阴性"(漏诊)的控制最优,这对临床筛查至关重要。
Klotho的剂量效应
RCS分析揭示Klotho与CHD风险呈近似线性负相关,临界值为787.2 pg/mL。当Klotho低于该阈值时,CHD风险显著上升。年龄分层显示,非CHD人群65岁后Klotho水平加速下降,而CHD患者这种衰老相关性衰减更平缓,暗示疾病状态可能改变Klotho代谢动力学。
特征重要性排序
RF模型的特征重要性图谱显示,年龄、Klotho和高血压位列前三甲。Klotho的预测权重超越传统因素如糖尿病和吸烟,SHAP分析进一步证实其对模型决策的贡献度达18.7%。
讨论与展望
该研究突破性地将衰老生物学标志物与AI预测模型结合,其临床意义体现在三方面:首先,证实血清Klotho检测可提升现有CHD风险评估体系的灵敏度;其次,RF模型的可解释性设计使"黑箱"算法更易被临床接受;最后,研究为Klotho替代疗法提供潜在干预靶点——当血清水平低于787.2 pg/mL时或需启动预防措施。
局限性在于依赖患者自报数据,且缺乏外部验证。研究团队透露正开发基于该模型的网页工具,未来将通过多中心研究验证其普适性。随着纳米载体递送Klotho基因的动物实验取得进展,这项研究可能为"精准抗衰老心血管防护"开辟新路径。
从更广阔的视角看,这项工作示范了如何利用公开数据库挖掘隐藏的生物标志物价值。在医疗AI时代,类似研究范式或将成为转化医学的新常态——从大数据中发现线索,用机器学习解码机制,最终反哺临床实践。正如研究者强调,当Klotho遇上随机森林,或许只是心血管疾病智能诊疗的一个起点。
生物通微信公众号
知名企业招聘