
-
生物通官微
陪你抓住生命科技
跳动的脉搏
整合多组学技术与机器学习方法,用于识别多发性硬化症风险预测的关键免疫基因
《Mammalian Genome》:Integrated multi-omics and machine learning prioritize key immune genes for multiple sclerosis risk prediction
【字体: 大 中 小 】 时间:2026年03月04日 来源:Mammalian Genome 2.7
编辑推荐:
多发性硬化症遗传机制研究通过整合基因组、转录组和蛋白组数据,利用孟德尔随机化和共表达网络分析鉴定出23个关键基因,并确定10基因签名(AUC达0.983),揭示免疫相关通路如NF-κB和Hedgehog信号通路的核心作用。
多发性硬化症(MS)是一种具有强烈遗传成分的复杂自身免疫性疾病,但其遗传机制在很大程度上仍未被充分探索。我们的目标是确定致病基因,并评估这些基因在MS风险预测中的实用性。我们通过基于汇总数据的孟德尔随机化(SMR)和共定位分析,将MS全基因组关联研究的结果与脑源性剪接定量性状位点(sQTLs)和表达定量性状位点(eQTLs)相结合,以识别潜在的致病基因。通过对E-MTAB-5151数据集进行加权基因共表达网络分析(WGCNA),我们发现了与MS相关的基因模块。LASSO回归确定了核心基因特征。GO和KEGG富集分析、免疫浸润分析以及基因集富集分析(GSEA)进一步探讨了这些基因的生物学相关性。利用独立的蛋白质定量性状位点(pQTL)数据集,进一步验证了这些基因与MS之间的关联。SMR共识别出28个sQTL基因和66个eQTL基因与MS相关,其中分别有23个和51个通过了共定位测试。WGCNA识别出三个与MS相关的基因模块,这些模块与SMR基因的交集进一步确定了23个关键基因。对这些模块基因和SMR基因的功能富集分析表明,免疫相关通路在MS中起着重要作用,包括淋巴细胞激活和NF-κB信号通路。LASSO回归建立了一个由10个基因组成的特征组合(ACP2、IL7、MYNN、RGS1、SAE1、SP140、TRAF3、TSPAN31、TYMP和ZC2HC1A),该特征组合在内部验证中的预测准确率为0.983;在三个外部数据集中的预测准确率也高于0.70。免疫浸润分析显示了一种一致的免疫细胞表达模式:MS风险基因的表达与幼稚CD4+ T细胞和静息状态下的肥大细胞呈正相关,而与活化状态的肥大细胞呈负相关。相反,具有保护作用的MS相关基因则表现出相反的模式。此外,MS全基因组关联研究统计结果的整合在蛋白质水平上验证了ZC2HC1A和TRAF3的作用。GSEA进一步将这两个基因与Hedgehog信号通路联系起来。通过整合基因组学、转录组学和蛋白质组学数据,我们发现了具有有力证据的MS潜在致病基因。ZC2HC1A和TRAF3已成为MS的有希望的生物标志物和机制候选基因。未来需要进一步的功能研究来阐明它们在MS发病机制中的分子作用。