机器学习揭示miR-3607-3p作为结核病免疫调控关键生物标志物的机制研究

《Scientific Reports》:Machine learning identifies MiRNA biomarkers and immune mechanisms in active tuberculosis

【字体: 时间:2025年10月17日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对结核病诊断生物标志物匮乏的临床挑战,通过整合机器学习与高通量测序数据,系统筛选出可区分活动性结核病(ATB)与潜伏感染(LTBI)的关键miRNA标志物。研究发现hsa-miR-3607-3p可通过caspase依赖途径调控巨噬细胞凋亡,进而影响结核分枝杆菌(Mtb)胞内生存。该成果为结核病早期诊断及免疫干预提供了新靶点,发表于《Scientific Reports》。

  
结核病(Tuberculosis, TB)是由结核分枝杆菌(Mycobacterium tuberculosis, Mtb)引起的慢性传染病,至今仍是全球重大公共卫生威胁。据世界卫生组织2024年报告,2023年全球因结核病死亡人数达125万,成为仅次于COVID-19的致命传染病。随着HIV/TB共感染及耐多药结核病(MDR-TB)的流行,结核病防控面临日益严峻的挑战。
结核分枝杆菌作为胞内病原体,可通过调控宿主免疫机制实现长期潜伏。巨噬细胞作为清除病原体的关键免疫细胞,其凋亡、自噬等过程在抗结核免疫中发挥核心作用。然而,Mtb能够逃逸免疫监视并在宿主细胞内持续存活,导致约10%的潜伏感染(LTBI)发展为活动性结核病(ATB)。目前,抗生素仍是结核病主要治疗手段,但耐药菌株的出现及治疗复杂性为疾病控制带来巨大困难。
近年来研究表明,Mtb不仅破坏宿主蛋白网络,还通过调控微小RNA(miRNA)介导免疫应答。miRNA是一类长约20-24核苷酸的非编码RNA,可通过结合靶基因3'非翻译区(3'UTR)调控基因表达,参与免疫、凋亡等重要生物学过程。例如Mtb可上调miR-33抑制自噬相关分子ATG5、ATG12表达,或诱导miR-144*抑制DRAM2进而抑制自噬。特定miRNA的差异表达已被提出作为结核病潜在诊断标志物,如miR-199a-3p、miR-6886-3p可区分ATB与LTBI,miR-155也被报道为活动性疾病标志物。然而,miRNA调控宿主应答Mtb的具体机制及其诊断价值仍待深入探索。
为突破这一瓶颈,研究人员开展了一项融合机器学习与实验验证的创新研究。通过分析基因表达汇编(GEO)数据库中的miRNA表达谱(数据集编号:GSE70425),结合多种机器学习算法筛选关键miRNA标志物,并利用THP-1巨噬细胞感染模型深入探讨了核心miRNA的免疫调控机制。该研究发表于《Scientific Reports》期刊,为结核病诊断与治疗提供了新的分子视角。
研究方法主要涵盖五大技术模块:首先从GEO数据库获取临床样本 miRNA 表达数据(包含16例ATB和16例LTBI样本),通过差异表达分析筛选候选miRNA;接着采用三种机器学习算法(LASSO回归、SVM-RFE和Boruta算法)进行特征选择;基于筛选结果构建九种机器学习诊断模型并评估性能;通过生物信息学方法预测miRNA靶基因并进行功能富集分析;最后利用THP-1巨噬细胞系建立Mtb感染模型,通过miRNA mimic转染、菌落形成单位(CFU)测定、流式细胞术、Western blot和qRT-PCR等技术验证miRNA功能。
差异表达分析结果
通过对GSE70425数据集的系统分析,研究人员鉴定出72个差异表达miRNA,其中43个在ATB样本中显著上调,29个在LTBI样本中下调。火山图分析突出显示hsa-miR-3607-3p在ATB患者中显著上调,热图可视化进一步证实其表达具有明显的组别特异性。
机器学习筛选特征miRNA
研究采用三种机器学习方法进行特征选择:LASSO回归识别13个候选miRNA,Boruta算法筛选27个关键miRNA,SVM-RFE确定31个候选miRNA。维恩图显示三种方法共同筛选出8个核心miRNA,包括hsa-miR-3607-3p、hsa-miR-148b、hsa-miR-519e等。
目标miRNA选择与诊断性能
表达分析显示hsa-miR-3607-3p、hsa-miR-148b、hsa-miR-150和hsa-miR-199b-5p在ATB中显著上调,而hsa-miR-519e、hsa-let-7b等在LTBI中高表达。SHAP值分析表明hsa-miR-3607-3p在分类模型中起关键作用。ROC曲线显示hsa-miR-3607-3p单独区分ATB与LTBI的AUC达0.980。基于8个miRNA构建的九种机器学习模型在训练集中AUC均达1.000,测试集中XGBoost、SVM等模型保持高诊断准确率。
hsa-miR-3607-3p靶基因预测与功能富集分析
通过TargetScan和miRDB数据库预测hsa-miR-3607-3p靶基因,构建miRNA-mRNA调控网络。GO分析显示靶基因主要富集于细胞核、细胞质等区域,参与蛋白质泛素化、细胞内信号转导等过程。KEGG通路分析发现靶基因显著富集于mTOR信号通路、AMPK信号通路、FoxO信号通路等与凋亡、炎症相关的通路。
hsa-miR-3607-3p对Mtb感染THP-1巨噬细胞的影响
功能实验表明,转染hsa-miR-3607-3p mimic可显著提高其在THP-1细胞中的表达。CFU实验显示过表达hsa-miR-3607-3p可增强Mtb胞内生存能力。流式细胞术检测发现hsa-miR-3607-3p显著抑制Mtb感染诱导的巨噬细胞早期和晚期凋亡。Western blot和qRT-PCR分析显示hsa-miR-3607-3p转染组中caspase-9、caspase-8、caspase-3和PARP表达显著下调,表明其通过caspase依赖途径调控凋亡。
研究结论与讨论部分强调,hsa-miR-3607-3p通过下调caspase-9、caspase-8、caspase-3和PARP表达,显著抑制Mtb感染后巨噬细胞凋亡,可能促进病原体胞内生存。这一发现不仅揭示了miRNA在结核免疫调控中的新机制,也为开发新型诊断标志物和治疗靶点提供了重要依据。与既往研究相比,hsa-miR-3607-3p表现出更优的诊断性能(AUC 0.980),其与凋亡通路的关联性通过生物信息学预测和实验验证得到了充分证实。
该研究的创新性在于整合计算生物学与实验验证方法,首次系统阐明hsa-miR-3607-3p在结核病发病机制中的调控作用。研究局限性包括依赖单一数据集、缺乏独立外部验证队列,以及功能实验仅限于细胞水平。未来研究需在动物模型和临床样本中进一步验证其生物学功能,并探索其作为诊断标志物的临床转化潜力。
总之,该研究通过多学科交叉策略成功鉴定出hsa-miR-3607-3p作为结核病潜在生物标志物,揭示了其通过caspase信号通路调控免疫应答的新机制,为结核病精准诊断和治疗策略开发提供了重要科学依据。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号