编辑推荐:
为解决慢性肾病(CKD)患者冠心病(CAD)早期诊断难题,研究人员基于生物信息学和机器学习,分析 GEO 数据库筛选炎症相关基因。发现 GCLM、NUPR1、PTGER1 为枢纽基因,前两者在验证队列显著上调,为 CAD 诊断和治疗提供新方向。
慢性肾病(CKD)患者常常面临着冠心病(CAD)高发的威胁,这一人群中 CAD 的患病率远高于普通人群,且由于肾功能障碍,CAD 的临床表现往往不典型,干预时不良反应风险也显著升高,导致 CAD 的管理极为复杂,因此实现 CKD 患者 CAD 的早期诊断和管理对于降低死亡率、改善预后至关重要。炎症被认为在 CAD 的发生发展中起着关键作用,在 CKD 患者中,随着肾功能恶化,尿毒症、氧化应激以及炎症因子清除减少常导致炎症状态加重,这可能是触发和加剧 CAD 风险的原因之一,然而目前缺乏通过综合生物信息学方法结合真实人群验证来探索 CKD 患者中与 CAD 高风险相关的炎症相关基因的研究。
为了填补这一研究空白,河北医科大学第四医院的研究人员开展了相关研究。他们希望通过筛选与炎症相关的生物标志物,为 CKD 患者 CAD 的早期诊断和治疗提供新的思路。该研究成果发表在《Scientific Reports》上。
研究人员主要采用了以下关键技术方法:从 GEO 数据库获取 CAD 相关的原始数据集 GSE113079(包含 93 例 CAD 和 48 例健康样本)以及 CKD 相关的 PBMC 数据集 GSE37171 和 GSE70528,运用 R 软件中的 “combat” 算法去除批次效应;利用 “Limma” 包筛选差异表达基因(DEGs),设定调整后 p≤0.05 且 | log2 ( fold change)|≥0.585 的筛选标准;借助 Weighted gene co - expression network analysis(WGCNA)分析基因共表达网络,确定与 CAD 显著相关的模块;运用 least absolute shrinkage and selection operator(LASSO)和 random forest(RF)两种机器学习算法筛选枢纽基因;通过酶联免疫吸附试验(ELISA)在包含 150 例维持性血液透析(MHD)患者和 42 例非 MHD 的 3 - 5 期 CKD 患者的队列中对枢纽基因进行外部验证;使用 CIBERSORT 分析免疫细胞浸润情况。
筛选 DEGs in CAD
通过对 CAD 数据集的分析,检测到 2882 个 DEGs,其中 1544 个上调基因,1338 个下调基因,并用热图展示了前 20 个上调和下调基因。
构建 WGCNA 网络并识别关键模块基因
计算得出软阈值功率设为 3 时最适宜,共识别出 25 个模块,其中蓝色模块与 CAD 呈最显著正相关(Correlation = 0.85,P value = 5e - 40),该模块基因与 DEGs 的交集得到 995 个重叠基因,作为 CAD 的关键基因。
关键基因的功能富集分析
GO 分析显示,这些关键基因主要参与信号转导、细胞间信号传导、细胞间黏附、炎症反应中的白细胞迁移等生物过程,细胞组分主要定位于质膜、细胞外空间和细胞表面,分子功能多集中于 G 蛋白偶联受体活性、信号受体结合和细胞因子活性。KEGG 通路分析表明,其主要参与细胞因子 - 细胞因子受体相互作用和白细胞跨内皮迁移,提示炎症反应在 CAD 形成和发展中起根本作用。
识别 CKD 相关 CAD 中的 IRGGs
整合 CKD 数据集并去除批次效应后,筛选出 1721 个 DEGs,从 GeneCards 数据库筛选出 4238 个炎症反应相关基因(IRGGs),通过韦恩图确定 CKD、CAD 和 IRGGs 的 14 个重叠 DEGs。
利用机器学习识别枢纽基因
通过 LASSO 和 RF 算法筛选,确定核蛋白 1(NUPR1)、谷氨酸半胱氨酸连接酶调节亚基(GCLM)和前列腺素 E 受体 1(PTGER1)为枢纽基因。
枢纽基因的验证
在 CAD 数据集的训练集和验证集中,三个枢纽基因的 ROC 曲线下面积(AUC)均大于 0.9,显示出良好的诊断价值。
免疫细胞浸润分析
CAD 患者中 T 细胞 CD4 naive、T 细胞调节性、T 细胞 gamma delta、单核细胞、巨噬细胞 M0 比例较高,而 T 细胞 CD8、T 细胞 CD4 记忆静止、T 细胞 CD4 记忆激活、自然杀伤细胞激活、树突状细胞激活、肥大细胞激活比例较低。枢纽基因与部分免疫细胞浸润呈正相关,提示其可能通过影响免疫细胞浸润参与 CAD 的发病机制。
枢纽基因的外部验证
在 MHD 患者中,除 PTGER1 外,GCLM 和 NUPR1 在 CAD 患者中显著升高,ROC 曲线显示 GCLM 和 NUPR1 具有良好的预测性能,两者联合分析进一步提高了诊断准确性。在非 MHD 的 3 - 5 期 CKD 患者中也得到了类似结果。
研究结论表明,通过综合生物信息学分析和机器学习技术,筛选出 GCLM、NUPR1 和 PTGER1 作为与 CKD 相关 CAD 的炎症相关枢纽基因,其中 GCLM 和 NUPR1 在不同 CKD 队列中均显示出对 CAD 的较高预测价值,为 CKD 患者 CAD 的早期诊断提供了新的生物标志物,也为治疗提供了潜在靶点。
讨论部分指出,微炎症状态破坏免疫耐受,诱导内皮炎症,促进动脉粥样硬化斑块形成,本研究的 GO 和 KEGG 分析结果与之一致,进一步证实了炎症在 CAD 中的核心作用。NUPR1 作为应激诱导蛋白,参与多种炎症反应,在 CKD 合并 CAD 患者外周血中上调,可能通过调节炎症和免疫发挥作用。GCLM 通过参与谷胱甘肽合成,影响氧化应激和炎症反应,其表达下调与动脉粥样硬化中的微血管功能障碍相关,提示其可能作为抗氧化应激的靶点。PTGER1 在本研究验证队列中未显著上调,可能与研究人群差异、代谢状态、细胞微环境及药物干预等因素有关,其在 CAD 中的作用仍需进一步研究。
该研究也存在一定局限性,如基于公共数据库和临床样本的回顾性研究,缺乏双病队列的转录组或多组学数据,验证队列局限于中国人群等。未来需要增加伴有心血管疾病的 CKD 患者测序数据集,扩大验证队列的地域和种族覆盖范围,以进一步探究心肾交互作用的遗传关联,提高研究结果的普遍性。