整合生物信息学与机器学习揭示2型糖尿病相关钙化性主动脉瓣疾病的免疫分泌蛋白标志物及治疗小分子药物
【字体:
大
中
小
】
时间:2025年10月10日
来源:Frontiers in Immunology 5.9
编辑推荐:
本综述通过整合GEO数据库中CAVD与T2DM的转录组数据,结合WGCNA、PPI网络及机器学习算法,首次系统鉴定出CDH19、COL1A2、PRG4、SPP1四个核心分泌蛋白标志物(AUC=0.95),揭示其通过趋化因子信号通路介导免疫微环境失衡(M1/M2巨噬细胞极化、T细胞亚型改变)驱动瓣膜钙化机制,并为PMA等小分子药物靶向治疗提供新策略。
2型糖尿病(T2DM)作为全球流行的代谢性疾病,与钙化性主动脉瓣疾病(CAVD)的发病机制存在密切关联。高血糖诱导的慢性炎症、氧化应激及免疫失调可能加速CAVD进展,但其分子机制尚未明确。本研究通过整合多组学数据与机器学习算法,旨在揭示T2DM相关CAVD的免疫分子标志物及潜在治疗策略。
研究整合了GEO数据库中的四个CAVD数据集(GSE12644、GSE51472、GSE153555、GSE83453)和两个T2DM数据集(GSE20966、GSE25724),使用sva包进行批次校正。通过limma包筛选差异表达基因(DEGs),应用加权基因共表达网络分析(WGCNA)鉴定关键模块基因,并从人类蛋白质图谱获取分泌蛋白基因集。蛋白质相互作用(PPI)网络通过STRING数据库构建,功能富集分析采用DAVID进行。利用连接性图谱(cMAP)预测潜在治疗化合物,并基于113种机器学习算法组合构建诊断模型。免疫细胞浸润分析使用CIBERSORT算法,实验验证包括RT-qPCR、Western blot及免疫组化。
批次校正后的整合CAVD数据集包含44例钙化样本和33例对照样本。主成分分析(PCA)显示校正后数据异质性显著降低。共鉴定出750个DEGs(427个上调、323个下调)。
WGCNA分析确定棕色模块与CAVD表型相关性最强(r=0.82, p=2×10?19),其429个基因与DEGs交集得到337个关键基因。
T2DM数据集分析获得445个DEGs,与分泌蛋白基因集交集筛选出142个T2DM相关分泌蛋白。
PPI网络识别出两个核心模块(46个基因)。GO分析显示这些基因显著富集于趋化因子介导的信号通路(chemokine-mediated signaling)、胶原蛋白三聚体复合物(collagen trimer complex)及受体结合功能。KEGG通路分析提示趋化因子信号通路和病毒蛋白-细胞因子受体相互作用通路激活。
cMAP分析预测出10种可能逆转疾病基因表达模式的化合物,其中佛波醇-12-肉豆蔻酸-13-乙酸酯(PMA)负富集分数最高,提示其治疗潜力。
基于13个交集基因,通过Stacking集成学习构建诊断模型。最优组合(Stepglm双向筛选+XGBoost)在训练集平均AUC达0.95。最终确定CDH19、COL1A2、PRG4、SPP1四基因模型,在独立验证集(GSE235995、GSE55492)保持高性能。
CAVD组织中发现M0巨噬细胞、M1巨噬细胞和γδT细胞比例升高,而浆细胞、活化NK细胞和M2巨噬细胞降低。CDH19与静息肥大细胞呈正相关(r=0.64),SPP1与滤泡辅助T细胞(r=0.50)及M0巨噬细胞(r=0.40)正相关。
临床样本验证显示:CDH19在T2DM-CAVD组织中表达下调,COL1A2、PRG4、SPP1显著上调(p<0.05)。Western blot及免疫组化结果与mRNA水平一致。CXCL12和MMP9蛋白表达上调提示趋化因子及基质重塑通路参与疾病进程。
本研究首次从分泌蛋白角度系统解析T2DM与CAVD的分子关联。四基因诊断模型(AUC=0.95)具有临床转化潜力。机制上,COL1A2通过TGF-β通路促进纤维化,SPP1通过PI3K/Akt通路驱动钙化,PRG4调控TLR4/NF-κB炎症通路,CDH19则与免疫细胞浸润密切关联。预测的PMA可能通过抑制PKC炎症通路延缓瓣膜钙化。局限性包括样本量不足及未进行血糖分层分析。
研究揭示了T2DM相关CAVD的免疫分泌蛋白网络机制,构建了基于CDH19、COL1A2、PRG4、SPP1的机器学习诊断模型,为疾病早期诊断及PMA等靶向治疗提供新思路。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号