《Nature Medicine》:Interpretable inflammation landscape of circulating immune cells
编辑推荐:
本研究利用单细胞转录组测序(scRNA-seq)技术,构建了涵盖19类炎症性疾病(包括自身免疫性疾病、感染、肿瘤等)的循环免疫细胞炎症图谱,通过对逾650万个外周血单核细胞(PBMC)的系统分析,揭示了炎症相关基因签名、转录因子调控网络(如STAT1/SP1)及细胞特异性免疫应答模式。研究进一步结合可解释机器学习(如XGBoost与SHAP算法)筛选疾病判别关键基因(如CYBA、IFITM1),并开发了基于细胞嵌入空间的疾病分类框架,为炎症性疾病的精准诊断提供了新策略。
炎症景观的系统性解析
研究通过整合1047例患者(涵盖19类炎症性疾病)的650万个外周血单核细胞(PBMC)单细胞转录组数据,构建了全球首个跨疾病炎症免疫细胞图谱。利用概率生成模型(scVI/scANVI)对数据进行批次校正后,通过递归聚类识别出64个免疫细胞亚群(Level 2),包括先天性与适应性免疫细胞的关键状态。细胞比例分析验证了疾病特异性改变,如系统性红斑狼疮(SLE)患者中非经典T细胞(UTC)比例降低,而单核细胞与B细胞扩增。
炎症相关基因签名的跨疾病活动模式
研究团队定义了21类炎症相关基因签名(如细胞黏附、趋化因子、抗原呈递等),并通过Spectra算法优化为119个细胞类型特异性因子。线性混合模型(LMEM)分析显示,免疫介导的炎症性疾病(IMID)中黏附分子、NF-κB信号通路及抗原呈递签名普遍激活。值得注意的是,干扰素(IFN)Ⅰ/Ⅱ型签名在多数IMID的CD8+T细胞中上调,其中FGFBP2+GZMB+效应记忆T细胞在溃疡性结肠炎(UC)中显著富集,提示其可能作为循环中上皮损伤相关T细胞的早期标志。
转录因子调控网络的疾病特异性活动
基因调控网络(GRN)分析揭示STAT1与SP1是IFN诱导签名的主要调控因子。在SLE患者中,STAT1活性在非经典单核细胞中升高,而SP1在髓系细胞中活跃;在流感(Flu)感染中,STAT1特异性激活于IFN应答CD8+T细胞。进一步对SLE患者 flare(疾病活动期)与non-flare状态的分析发现,STAT1在CD8+T细胞中活动增强,而SP1在髓系细胞中更活跃,提示二者在疾病动态进展中的互补作用。
可解释机器学习驱动关键基因发现
通过梯度提升决策树(GBDT)模型与SHAP值分析,研究筛选出疾病判别关键基因。例如,CYBA(编码吞噬细胞氧化酶组分)在肠道炎症性疾病(UC/CD)中高表达,而在银屑病(PS)及银屑病关节炎(PsA)中低表达,可能与组织特异性氧化应激反应相关;IFITM1在慢性阻塞性肺疾病(COPD)的CD4+T细胞及固有淋巴样细胞(ILC)中高表达,或促进淋巴细胞肺部聚集。
基于细胞嵌入空间的疾病分类框架
研究提出一种新型患者分类流程:通过scANVI将查询患者细胞映射至参考图谱的嵌入空间,再基于细胞类型特异性嵌入训练分类器。在未见患者数据(Scenario 2)中,分类器加权F1分数(WF1)达0.98;然而在跨研究验证(Scenario 3)中性能下降(WF1=0.23),凸显批次效应对泛化能力的挑战。通过集中化数据集(单一中心、标准化实验流程)优化后,分类性能显著提升(WF1=0.56),为未来临床转化提供了优化方向。
讨论与展望
该研究首次系统性绘制了循环免疫细胞的炎症景观,并建立了可解释的疾病分类模型。未来需扩大样本多样性(如多祖先背景)、优化批次校正策略,并探索循环细胞与组织驻留免疫状态的关联,以推动炎症性疾病的精准诊疗发展。