
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于血清胱抑素C(CysC)的糖尿病合并高血压风险预测模型构建及多队列验证
【字体: 大 中 小 】 时间:2025年07月06日 来源:iScience 4.6
编辑推荐:
本研究针对糖尿病(DM)合并高血压(HTN)患者心血管风险显著升高但缺乏有效预测指标的问题,通过多队列横断面研究揭示了血清胱抑素C(CysC)作为独立风险因子的关键作用。研究人员整合中国CHARLS数据库、美国NHANES数据库及自建临床队列共5210例患者数据,构建了包含CysC浓度(阈值0.94 mg/L)的预测模型,经10种机器学习算法验证显示优异性能(AUC=0.81-0.83)。该研究为早期识别高风险患者提供了新型生物标志物和临床决策工具。
在全球糖尿病患病率持续攀升的背景下,糖尿病合并高血压(DM+HTN)患者面临更严峻的心血管疾病风险。国际糖尿病联盟数据显示,目前全球约5.37亿成人罹患糖尿病,预计2045年将增至7.83亿。更令人担忧的是,中国横断面研究显示59.9%的2型糖尿病患者合并高血压,而美国数据甚至高达76.3%。这两种"同源性疾病"的共病状态会显著加速靶器官损伤,增加致残率和死亡率,但现有预测模型多依赖传统指标,缺乏敏感特异的生物标志物。
针对这一临床困境,昆明医科大学附属延安医院的研究团队开展了一项创新性多队列研究。他们巧妙整合了自建临床数据(3348例)、中国健康与养老追踪调查(CHARLS)数据库(1085例)和美国国家健康与营养调查(NHANES)数据库(777例),通过系统分析血清胱抑素C(Cystatin C, CysC)——一种反映肾小球滤过率的内源性标志物,与DM+HTN风险的关联。研究采用免疫比浊法检测CysC浓度,通过多变量逻辑回归构建预测模型,并应用限制性立方样条(RCS)分析阈值效应。为验证模型可靠性,团队创新性地引入10种机器学习算法(包括XGBoost、随机森林等)和SHAP解释性分析。
关键技术方法包括:1) 多源数据整合策略,涵盖中美两国三大队列;2) 基于限制性立方样条的阈值效应分析确定CysC临界值;3) 机器学习模型验证体系,采用CatBoost、LGBM等10种算法;4) SHAP值驱动的模型可解释性研究。所有统计分析均通过Python和R语言实现,严格遵循TRIPOD和STROBE指南。
三队列数据均显示DM+HTN患者具有显著特征:年龄更大(63±9 vs 58±9岁,p<0.01)、BMI更高(25.2±4.43 vs 23.7±4.22 kg/m2,p=0.003),且血清CysC水平显著升高(1.05±0.32 vs 0.97±0.25 mg/L,p=0.02)。实验室指标中,尿酸(UA)、肌酐(SCR)等肾功能相关指标也呈现一致差异。
多因素校正模型显示,CysC浓度每增加1 mg/L,DM+HTN风险显著升高(OR=1.94,95%CI 1.45-2.58,p<0.001)。这种关联在不同队列中保持稳定:CHARLS数据库OR=3.78,NHANES数据库OR=6.33。值得注意的是,RCS分析发现0.94 mg/L是关键拐点,高于此值风险曲线显著陡峭(OR per SD=1.39 vs 0.93)。
构建的预测模型整合了年龄、性别、BMI等协变量,展现出优异的判别能力:自建数据AUC=0.81,CHARLS数据AUC=0.79,NHANES数据AUC=0.83。决策曲线分析(DCA)证实该模型在广泛阈值概率范围内具有临床净获益。
10种算法验证中,XGBoost和LGBM表现最佳(外部验证AUC=0.86)。SHAP分析揭示CysC的预测贡献度最高,且发现年龄>60岁、女性、低BMI患者在CysC>1.16 mg/L时风险增幅更显著。
该研究首次系统证实血清CysC是DM+HTN的独立预测因子,并建立了首个基于CysC的多参数预测模型。其创新价值体现在三方面:1) 发现0.94 mg/L的临床临界值,为早期干预提供量化标准;2) 通过多队列设计增强结果外推性;3) 结合传统统计与机器学习,提升模型稳健性。
临床转化方面,该模型可帮助医生识别CysC>0.94 mg/L的高危患者,提前启动强化降压治疗。未来研究可探索CysC参与血压调控的分子机制,并开发便携式检测设备。论文发表于《iScience》期刊,为糖尿病并发症防控提供了新思路。
生物通微信公众号
知名企业招聘