基于系统性红斑狼疮相关基因的多发性骨髓瘤诊断模型构建及特异性基因筛选

【字体: 时间:2025年05月19日 来源:Discover Oncology 2.8

编辑推荐:

  【编辑推荐】为提升 SLE 相关 MM 的鉴别能力,研究人员通过生物信息学结合机器学习,分析 MM 与 SLE 的共表达基因,构建诊断模型。发现 63 个交集基因,确定 H2BC5 为特异性基因,为 MM 早期诊断及临床干预提供新视角。

  
多发性骨髓瘤(MM)是一种常见的血液系统恶性肿瘤,其特征是骨髓中异常浆细胞的克隆性增殖,约 90% 的患者会出现溶骨性病变、高钙血症、脊髓压迫和剧烈骨痛等症状,目前仍无法治愈。系统性红斑狼疮(SLE)是一种慢性全身性自身免疫性疾病,越来越多的证据表明,SLE 患者发生多种癌症的风险较高,尤其是血液系统肿瘤,MM 与 SLE 的关联日益受到关注,但两者之间的相互作用及潜在致病机制尚缺乏深入研究。早期识别 SLE 患者中的潜在 MM 尤为重要,但两者初诊时症状常无特异性,易漏诊或误诊,因此亟需开发一种全面的诊断模型以帮助早期发现 SLE 患者中的 MM。

成都中医药大学及其附属医院的研究人员开展了相关研究,旨在阐明 MM 和 SLE 的共同致病途径,并开发相应的诊断模型。研究成果发表在《Discover Oncology》。

研究人员采用综合生物信息学分析结合机器学习技术,从公共数据库提取相关数据。首先从 NCBI GEO 数据库筛选出 4 个转录组数据集(GSE5900、GSE6477、GSE61635、GSE50772)作为训练集,GSE118985 作为验证集,GSE24080 和 GSE57317 用于生存分析,通过 “SV A” 包校正批次效应并合并数据,利用主成分分析(PCA)评估数据质量。接着筛选 MM 和 SLE 数据集的差异表达基因(DEGs),通过 GO 和 KEGG 通路分析研究其功能和通路富集情况,使用 STRING 数据库构建交集基因的蛋白质 - 蛋白质相互作用(PPI)网络,并借助 Cytoscape 软件中的 cytoHubba 插件识别关键基因。然后比较 113 种 12 机器学习算法的组合,确定最佳诊断模型。此外,还利用 DGIdb 数据库预测潜在的药物 - 基因相互作用,通过孟德尔随机化(MR)分析和免疫细胞浸润分析进一步探究关键基因的作用。

3.1 SLE 和 MM 的差异表达分析


整合 MM 和 SLE 训练集进行差异分析,SLE 队列发现 1761 个 DEGs(1044 个上调,717 个下调),MM 队列发现 1213 个 DEGs(534 个上调,679 个下调),两者交集得到 63 个共享基因(31 个上调,32 个下调),并对前 50 个 DEGs 进行了可视化。

3.2 交集致病基因的功能富集


GO 富集分析显示,上调的共同基因主要参与阿米巴样细胞迁移、细胞生长等生物过程,下调的共同基因主要与免疫反应激活信号通路、细胞间粘附调节等相关。KEGG 分析表明,过表达基因主要参与 PI3K-Akt 信号通路、人乳头瘤病毒感染和细胞因子 - 细胞因子受体相互作用等通路。

3.3 PPI 网络构建与关键基因识别


将 63 个共同基因输入 STRING 构建 PPI 网络,得到包含 38 个节点和 51 条边的网络,通过 cytoHubba 插件识别出 9 个关键基因(CDH1、IL4、AURKB、HGF、H2BC9、H2BC17、H2BC5、AREG、TJP1),其中 7 个(CDH1、IL4、AURKB、HGF、H2BC9、AREG、TJP1)已被证实与 MM 直接相关,H2BC5 被确定为与 SLE 相关 MM 相关的特异性基因。

3.4 SLE 相关 MM 诊断模型的构建


利用 12 种机器学习算法的 113 种组合,基于 9 个关键基因构建诊断模型,最终确定集成 NaiveBayes 算法为最佳模型,训练和验证集的 AUC 值均超过 0.7,显示出较高的准确性和稳定性。

3.5 药物 - 基因相互作用


通过 DGIdb 数据库筛选出 33 种基于 9 个关键基因的已验证药物,排名前 10 的药物包括绒毛膜促性腺激素、比卡鲁胺、帕尼单抗等。

3.6 SLE 和 MM 的免疫细胞浸润分析


MM 队列中 M1 巨噬细胞、静息肥大细胞和活化肥大细胞的比例存在显著差异,SLE 队列中天然 CD4 T 细胞的比例低于对照组。

3.7 MR 分析


通过 MR 分析确定 H2BC5 与 MM 风险显著相关,H2BC5 的高表达与 MM 风险增加显著相关。

3.8 特异性基因的识别与生存分析


H2BC5 被确定为与 SLE 相关 MM 最相关的基因,其高表达组主要参与系统性红斑狼疮、氧化磷酸化等通路,生存分析表明 H2BC5 高表达与 MM 患者的总体生存率较差相关。

3.9 训练和验证组差异分析


验证队列中,IL4 和 H2BC17 在对照组和验证组之间无显著差异,其他关键基因均显示出显著差异,MM 样本中 H2BC5 的表达显著高于健康对照组,与 MR 分析结果一致。

本研究建立了 MM 早期诊断的新分子框架,特别是在 SLE 患者中。研究结果强调 H2BC5 可能作为生物标志物,为进一步研究其在 MM 发展中的作用提供了依据。通过识别 SLE 和 MM 的共同致病机制,为未来的临床干预和个性化治疗提供了新的视角。然而,本研究主要依赖生物信息学和机器学习算法,缺乏临床患者、动物模型或细胞水平的实验验证,H2BC5 在 MM 诊断和识别中的作用仍需进一步研究。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号