机器学习与孟德尔随机化联袂揭示相分离相关基因HSPA1A/NSUN5作为肾纤维化早期诊断的新型生物标志物

【字体: 时间:2025年07月01日 来源:In Silico Research in Biomedicine

编辑推荐:

  本研究针对肾纤维化早期诊断标志物匮乏的临床难题,创新性地整合监督/无监督机器学习与孟德尔随机化(MR)技术,通过分析GEO数据库GSE66494数据集(61例样本),鉴定出HSPA1A和NSUN5等相分离相关核心基因,构建AUC达1.000的预测模型,揭示急性肾衰竭通路(p=0.01)与疾病进展的因果关系,为慢性肾病(CKD)的精准诊疗提供新靶点。

  

慢性肾脏病已成为全球公共卫生挑战,其中肾纤维化是导致肾功能不可逆损伤的关键病理过程。当前临床依赖侵入性肾穿刺活检进行诊断,但该方法存在创伤大、灵敏度低等局限,尤其难以捕捉早期纤维化信号。更棘手的是,肾纤维化涉及相分离(LLPS)介导的细胞膜蛋白异常聚集、免疫细胞浸润及多重代谢通路紊乱,传统研究方法难以系统解析其分子机制。在这一背景下,中国研究人员通过多组学整合分析,在《In Silico Research in Biomedicine》发表突破性成果。

研究团队运用三大关键技术:1) 基于GEO数据库获取61例人类肾组织转录组数据(GSE66494),采用limma包进行差异表达分析;2) 整合支持向量机递归特征消除(SVM-RFE)、LASSO回归和随机森林(RF)三种机器学习算法筛选标志物;3) 通过双样本孟德尔随机化(TSMR)和贝叶斯加权MR(BWMR)验证基因-疾病的因果关系。

3.1 GEO数据校正
对6例正常和55例病变样本进行标准化处理,发现ALB表达下降至9%(log FC=-3.41),而TTLL3等基因显著上调。

3.2 基因集富集分析
GSEA鉴定153个差异基因,其中肾素分泌通路(NES=0.60)和细胞粘附分子显著激活,而细胞色素P450代谢通路抑制(NES=-0.79)。

3.3 加权基因共表达网络
WGCNA揭示ME tan模块与疾病强相关(cor=0.85),HSPA1A(MM=0.79)和NSUN5(MM=0.92)为核心基因。

3.5 机器学习分析
SVM-RFE显示包含≥2基因时预测准确率达100%,RF算法确定HSPA1A(重要性=3.76)和NSUN5(重要性=2.75)为最优标志物。

3.6 逻辑回归模型
构建的列线图模型AUC达0.906,其中HSPA1A和NSUN5的单项AUC均为1.000,校准曲线显示优异拟合度。

3.9 单样本GSEA
NSUN5与GSE22611_NOD2通路强正相关(cor>0.50),而HSPA1A主要关联免疫抑制通路,提示二者通过不同机制促进纤维化。

3.10 孟德尔随机化
MR-IVW证实急性肾衰竭对慢性肾病存在因果效应(OR=1.08[1.02-1.15],p=0.01),BWMR的ELBO曲线验证模型稳定性。

这项研究首次阐明相分离相关基因HSPA1A通过调控醛固酮介导的钠重吸收通路(p=0.045)和cAMP信号转导,而NSUN5通过核糖体通路(NES=-0.91)共同驱动肾纤维化进程。创新性地将机器学习筛选与MR因果推断相结合,不仅克服了传统生物标志物研究的相关性局限,更通过六种无监督算法(包括生成对抗网络GAN)验证了模型鲁棒性。发现的HSPA1A/NSUN5标志物组合为开发无创诊断试剂盒奠定基础,同时揭示的急性肾衰竭转化通路为临床干预提供新靶点。值得注意的是,相分离现象与免疫代谢重编程的关联机制仍待深入探索,这将是未来转化研究的重要方向。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号