基于生物信息学与机器学习鉴定NAFLD与动脉粥样硬化共享的氧化应激关键枢纽基因

《Scientific Reports》:Identification of shared oxidative stress related hub genes in NAFLD and atherosclerosis using bioinformatics and machine learning

【字体: 时间:2026年01月06日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对非酒精性脂肪肝病(NAFLD)与动脉粥样硬化(AS)共病机制不明确的难题,通过整合GEO数据库转录组数据与机器学习算法,系统性筛选出20个共表达氧化应激相关差异基因,最终鉴定ADM和IL2RB为具有显著诊断价值的关键枢纽基因(AS中AUC分别达0.787/0.887,NAFLD中达0.979/0.931)。构建的列线图模型在两种疾病中均展现出优异预测性能(AUC>0.9),为跨疾病治疗靶点开发提供新视角。

  
在全球肥胖和代谢综合征流行的大背景下,非酒精性脂肪肝病(NAFLD)已发展成为发达国家及中国经济发达地区慢性肝病的主要诱因,全球患病率高达30%。更令人警惕的是,流行病学研究显示NAFLD患者发生动脉粥样硬化(AS)的风险显著高于普通人群,这两种疾病在氧化应激、慢性炎症等病理生理机制上存在交集。然而,关于这两种疾病协同进展中的关键分子及其调控网络,特别是氧化应激相关基因的共表达模式及其诊断潜力,目前尚缺乏系统分析。
氧化应激作为NAFLD和AS的共同触发因素,可通过活性氧(ROS)途径诱导脂质过氧化和 mitochondrial dysfunction(线粒体功能障碍),导致炎症细胞浸润,促进肝纤维化和动脉斑块形成。尽管已有研究描述了单个氧化应激相关基因(如SOD2、NOX4)在NAFLD或AS中的功能,但在识别这两种疾病共享的枢纽基因及其交互调控网络方面仍存在空白。
发表于《Scientific Reports》的这项研究,通过整合生物信息学与机器学习方法,深入探索了NAFLD与AS共享的氧化应激相关枢纽基因及潜在机制。研究人员从GEO数据库获取了NAFLD(GSE89632)和AS(GSE100927)的人体组织基因表达谱,与GeneCards数据库中的1398个氧化应激相关基因进行交叉分析,筛选出共表达的差异表达基因。通过功能富集分析揭示相关生物学过程,并运用最小绝对收缩和选择算子(LASSO)回归与支持向量机(SVM)等机器学习算法筛选关键基因。
研究首先鉴定出20个NAFLD与AS共表达的氧化应激相关差异基因(8个上调,12个下调)。功能富集分析显示这些基因主要富集于MAPK信号通路、FoxO信号通路等关键生物学过程。机器学习方法进一步筛选出ADM和IL2RB作为共表达的氧化应激相关枢纽基因,它们在AS中的AUC值分别为0.787和0.887,在NAFLD中分别为0.979和0.931,显示出显著诊断价值。基于这两个枢纽基因构建的列线图模型在两种疾病中均表现出优异的预测准确性,AUC值均超过0.9。
共表达氧化应激相关差异基因的鉴定
通过差异基因筛选标准(|Log2FC|>0.58且p.adj<0.05),在AS样本中鉴定出1966个差异表达基因,在NAFLD样本中鉴定出2354个差异表达基因。将这些差异表达基因与1398个氧化应激相关基因交叉后,最终确定20个共表达的差异基因,包括8个上调基因和12个下调基因。热图显示了这20个基因在AS和NAFLD样本中的相对表达情况,蛋白互作网络揭示了这些基因间的相互作用关系。
共表达差异基因的功能富集分析
GO富集分析结果显示,这些共表达差异基因主要参与"应激激活的MAPK级联"、"信号受体激活剂活性"、"应激激活蛋白激酶信号级联"以及"细胞因子受体结合"等生物过程。KEGG富集分析表明这些基因主要参与"MAPK信号通路"、"FoxO信号通路"、"趋化因子信号通路"、"细胞因子-细胞因子受体相互作用"以及"细胞衰老"等通路。
通过机器学习筛选共表达氧化应激相关枢纽基因
采用LASSO回归和SVM分析对20个共表达差异基因进行进一步筛选。LASSO回归通过十折交叉验证确定最佳参数,SVM分析通过径向基函数核函数计算特征变量权重。最终取两种方法筛选结果的交集,确定ADM和IL2RB为共表达的氧化应激相关枢纽基因。
ADM和IL2RB在NAFLD和AS中的诊断价值及TF-mRNA调控网络构建
ROC曲线分析显示,ADM和IL2RB在AS中的AUC值分别为0.787和0.887,在NAFLD中分别为0.979和0.931,表明这两个枢纽基因在两种疾病中均具有良好的诊断价值。通过TRRUST数据库预测显示,GTF3A、CEBPB和TFAP2A是ADM的预测调控转录因子,而EGR1、ETS1、RXRA、SP1和WT1是IL2RB的预测调控转录因子。
列线图模型的构建与诊断价值评估
将AS数据集(GSE100927)和NAFLD数据集(GSE89632)按7:3的比例分为训练集和验证集。基于筛选出的枢纽基因ADM和IL2RB,在AS和NAFLD的训练集中构建诊断列线图模型。校准曲线、决策曲线分析(DCA)和ROC曲线评估表明,列线图模型在训练集和验证集中均表现出良好的预测性能。
免疫相关细胞浸润评估结果
免疫细胞浸润分析显示,与对照组相比,AS组织样本中"aDC"、"B细胞"、"CD8+T细胞"、"细胞毒性细胞"、"嗜酸性粒细胞"、"iDC"、"巨噬细胞"、"肥大细胞"、"中性粒细胞"、"NK CD56bright细胞"、"NK CD56dim细胞"、"T细胞"、"Tcm"、"Tem"、"TFH"、"Th17细胞"和"Th2细胞"水平显著升高,而"NK细胞"和"Tgd"水平显著降低。在NAFLD组织样本中,"细胞毒性细胞"、"T细胞"、"T辅助细胞"、"Tcm"、"Tem"、"Tem"、"Tgd"、"Th17细胞"、"Th2细胞"和"TReg"水平显著升高,而"B细胞"、"CD8+T细胞"、"嗜酸性粒细胞"、"巨噬细胞"、"中性粒细胞"、"NK CD56dim细胞"和"Th1细胞"水平显著降低。
本研究通过整合生物信息学与机器学习方法,成功识别出NAFLD与AS共享的氧化应激相关枢纽基因ADM和IL2RB,并揭示MAPK信号通路、FoxO信号通路等在这些疾病共病机制中的重要作用。ADM作为一种多功能肽激素,具有血管舒张、抗炎、抗氧化和代谢调节作用,可能通过刺激PI3K/Akt信号通路抑制TNF-α和IL-6等促炎物质分泌来减轻肝脏炎症。在AS中,ADM可能通过激活内皮细胞中的AKT/eNOS途径促进一氧化氮(NO)释放并改善血管舒张。IL2RB作为IL-2和IL-15的共同受体亚基,主要影响免疫相关代谢和炎症反应。在NAFLD进展中,IL-2RB信号失衡可能导致肝脏免疫微环境失调,加剧炎症反应和纤维化。在AS中,IL-2RB可能参与斑块内巨噬细胞和T细胞的活化,促进干扰素-γ(IFN-γ)等促炎细胞因子的分泌,从而加速斑块进展。
免疫细胞浸润分析结果显示,AS和NAFLD组织中多种免疫细胞亚群的比例和活性发生显著改变,表明免疫微环境失调在这两种疾病的发病机制中可能发挥重要作用。这些发现不仅深化了对NAFLD和AS免疫病理机制的理解,也为针对免疫细胞及其分子信号的靶向治疗策略提供了新的理论依据。
该研究的创新之处在于首次系统识别了NAFLD与AS共享的氧化应激相关枢纽基因,并构建了具有高预测准确性的诊断模型。这些发现为临床诊断提供了新的生物标志物,也为开发针对这两种疾病的共同治疗靶点奠定了理论基础。然而,研究仍存在一定局限性,如依赖于公共数据库的样本量有限,未来需要更大规模、更多样化的队列研究来验证这些发现的普适性。此外,已识别的信号通路和枢纽基因的具体作用机制仍需通过后续实验进一步验证。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号