基于生物信息学与机器学习的莱姆病潜在生物标志物FCGR1B、MPP1和HSPA6的发现及其免疫机制研究

《Clinical and Experimental Medicine》:Identification of potential biomarkers for Lyme disease using bioinformatics and machine learning

【字体: 时间:2025年11月01日 来源:Clinical and Experimental Medicine 3.5

编辑推荐:

  本研究针对莱姆病早期诊断困难的问题,通过整合GEO数据库转录组数据与机器学习算法(LASSO、RF、SVM-RFE),筛选出FCGR1B、MPP1和HSPA6三个关键基因作为潜在诊断标志物,并揭示其与单核细胞免疫浸润及昼夜节律通路的关联,为开发新型诊断策略提供理论依据。

  
莱姆病(Lyme disease, LD)作为一种由伯氏疏螺旋体引起的蜱媒传染病,每年在全球范围内导致数十万人感染。其早期特征性游走性红斑虽为典型症状,但出现率仅60%-70%,且疾病进展可能引发关节炎、心脏炎甚至神经系统损伤等严重并发症。当前诊断依赖血清学检测和PCR技术,但前者存在感染后2-4周的窗口期敏感度不足,后者则受限于样本来源特异性问题。这种诊断困境使得开发高灵敏度、高特异性的早期检测手段成为当务之急。
为突破这一瓶颈,广州医科大学研究团队在《Clinical and Experimental Medicine》发表最新研究,通过生物信息学与机器学习融合分析,首次系统性筛选出莱姆病关键诊断标志物,并深入解析其免疫调控机制。研究团队从GEO数据库获取GSE145974(急性莱姆病患者与健康对照外周血单核细胞转录组数据)和GSE63085(早期播散性莱姆病治疗前后动态样本)两组数据集,构建多阶段验证框架。
关键技术方法包括:基于limma包的差异表达基因筛选(阈值|log2FC|≥1且adj.P<0.05)、WGCNA共表达网络模块分析(软阈值功率=19)、三种机器学习算法(LASSO回归、随机森林RF、支持向量机递归特征消除SVM-RFE)交叉验证核心基因,并通过CIBERSORT进行22种免疫细胞浸润分析,最终利用ROC曲线评估诊断效能。
识别差异表达基因与机器学习筛选枢纽基因
通过对GSE145974数据集分析,共鉴定出91个差异表达基因(DEGs),其中65个上调、26个下调。热图与火山图显示莱姆病患者存在显著炎症相关基因表达谱。三类机器学习算法交叉验证发现FCGR1B、MPP1和HSPA6为共同枢纽基因:LASSO筛选出15个基因(含FCGR1B、MPP1),RF重要性评分中FCGR1B与MPP1位列前茅,SVM-RFE确定36个特征基因,三法交集最终锁定三个枢纽基因。
诊断效能验证
在训练集GSE145974中,FCGR1B、MPP1和HSPA6的AUC值均超过0.90。外部验证集GSE63085(因平台限制未检测HSPA6)显示FCGR1B与MPP1的AUC仍高于0.80。箱式图进一步证实三个基因在莱姆病患者中表达显著上调,表明其跨数据集稳定性。
基因集富集与通路分析
单基因GSEA提示FCGR1B富集于蛋白酶体通路与单碳代谢,HSPA6关联中性粒细胞胞外陷阱形成且与昼夜节律调控负相关,MPP1则参与抗叶酸耐药和糖链降解通路。全局DEGs富集分析凸显免疫应答与昼夜节律通路异常,如“蛋白酶体”“醛固酮调控钠重吸收”等通路激活。
免疫浸润景观重塑
CIBERSORT分析揭示莱姆病患者单核细胞与M0型巨噬细胞显著增多,而静息CD4记忆T细胞减少。相关性分析显示FCGR1B和MPP1表达与单核细胞浸润程度正相关,印证其在先天免疫激活中的核心地位。
研究结论表明,FCGR1B(Fcγ受体IB)、MPP1(膜突蛋白1)和HSPA6(热休克蛋白70家族成员6)通过调控单核/巨噬细胞介导的先天免疫应答与昼夜节律通路,成为莱姆病潜在诊断标志物。WGCNA鉴定的蓝色模块(中性粒细胞活化)与红色模块(线粒体功能障碍)进一步佐证免疫代谢重编程在疾病中的作用。该研究不仅为早期诊断提供新型分子靶标,更揭示莱姆病进程中免疫-代谢交叉对话机制,为开发靶向治疗策略开辟新方向。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号