《Cell Genomics》:Enhanced interpretation of immune cell phenotype and function through a rhesus macaque single-cell atlas
编辑推荐:
推荐阅读!本文构建恒河猴免疫参考图谱(RIRA),对比转录组谱和免疫细胞传统定义,发现 T 细胞和自然杀伤(NK)细胞等存在转录相似但功能不同的情况,还确定了诊断基因模块,为准确解读单细胞 RNA 测序(scRNA-seq)数据提供重要参考。
研究背景
免疫系统细胞一直是科研的热门对象,此前常用的研究技术各有优劣。流式细胞术每次检测的蛋白标记数量有限(一般少于 14 个),但所测标记能有效反映免疫细胞的功能特性,且基于标记基因的定义在文献描述和实验重复上都很方便。而单细胞 RNA 测序(scRNA-seq)能同时检测数千个基因,可全面刻画细胞功能和分化状态,不过其数据与传统基于标记基因的免疫细胞定义存在差异。这种差异源于技术、生物学和生物信息学等多方面因素,如细胞内 RNA 和蛋白质的差异调控,会导致表面蛋白谱和 scRNA-seq 数据不一致;此外,scRNA-seq 数据分析常用的无监督技术,虽能有效识别转录多样性,但所依据的转录组变化与细胞谱系或功能的定义并不完全一致,容易混淆细胞类型和状态。为解决这些问题,研究人员构建了恒河猴免疫参考图谱(RIRA),旨在更准确地解读 scRNA-seq 数据,加深对免疫细胞的理解。
研究方法
- 样本采集与处理:研究人员从 47 只临床健康的恒河猴(RMs)的 7 个不同组织中获取单细胞悬浮液,这些组织包括肝脏、脾脏、肺、骨髓、外周血单核细胞(PBMCs)等。样本采集后,通过脂质细胞哈希技术和 CITE-seq 抗体标记来检测表面蛋白,随后使用 10X Genomics 5′捕获方法进行处理。处理过程中,经过多步严格的质量控制和筛选,确保数据的可靠性。
- 数据分析流程:首先对数据进行降维处理(PCA/UMAP),采用两步法对细胞进行粗略分类。先利用恒河猴适配的基因模块和 scGate R 包,依据主要细胞类型的标记基因对细胞进行富集评分,对于无法准确分类的细胞,进一步通过筛选高置信度细胞、下采样构建训练数据集,再使用 CellTypist 训练机器学习分类器,最终为大部分细胞提供准确标签。之后,对每种粗略分类的细胞类型进行无监督分析,深入探究其转录景观,包括确定主要转录亚群、基于免疫定义为这些亚群标注标签、寻找具有高诊断价值的 RNA 特征等。
研究结果
- 髓样细胞转录多样性:数据集包含 41,199 个髓样细胞,经处理和无监督聚类后识别出 19 个转录簇,进一步分组为 14 种细胞类型 / 状态。在单核细胞谱系中,经典单核细胞除表达 CD14 外,versican(VCAN)是更可靠的标记;非经典单核细胞则以 CX3CR1 和 CD11c(ITGAX)等 RNA 标记更为特异。巨噬细胞谱系存在多种具有不同组织特异性的亚群,如肺肺泡巨噬细胞(AMs),其特征为补体表达缺失、CHIT1 和载脂蛋白基因表达,且可分为两个主要亚群;肝脏中的巨噬细胞则高表达 DC-SIGN(CD209)和 FABP3。此外,还鉴定出浆细胞样树突状细胞(pDCs)、常规 / 经典树突状细胞(cDCs)以及粒细胞前体细胞等,每种细胞都有其独特的标记基因。
- B 细胞转录多样性:89,788 个 B 细胞形成 8 个无监督簇,分为 5 个子集。细胞增殖是转录多样性的重要驱动因素,如前 B 细胞、生发中心(GC)细胞和浆细胞各自形成明显不同的群体,且具有高度特异性的 RNA 标记。成熟 B 细胞中存在转录不同的亚群,但部分标记表达呈连续模式,难以明确划分亚群。通过对多基因模块的富集评分,可有效分类这些亚群。
- T 细胞和 NK 细胞转录多样性:对 290,113 个 T 细胞和 NK 细胞的研究发现,它们虽为不同子集,但在抗原刺激模式、效应功能和转录方面存在相似性。通过对比转录簇与经典谱系、分化状态和抗原识别模式,发现基于转录相似性的聚类并不完全等同于功能相似性。例如,关键谱系标记(如 CD3、CD4、CD8A 和 CD8B)的 RNA 表达在 T 细胞和 NK 细胞中并不稳定,且许多转录簇包含功能不同的细胞类型。进一步研究发现,幼稚到记忆 T 细胞的分化是 T 细胞转录变异的重要驱动因素,但这是一个连续过程,其转录特征与经典蛋白标记不同;细胞毒性与辅助性 T 细胞以及 CD4/CD8 共受体表达之间也存在复杂关系,细胞毒性相关基因是转录变异的主要驱动因素,而辅助性 T 细胞的阳性标记较少。此外,研究人员通过独立的分选参考 T 细胞数据集,证实了一些基因模块(如 S100 蛋白表达和颗粒酶基因表达模式)在 T 细胞和 NK 细胞分类中的诊断价值,并开发了效应分化评分(EDS)来量化 T 细胞的分化状态,该评分在不同物种的 T 细胞数据集中均表现出良好的适用性。
研究结论
- 图谱构建与细胞分类意义:本研究构建的 RIRA 是首个针对恒河猴的单细胞免疫图谱,为理解免疫细胞转录多样性提供了全面视角。在粗略细胞类型层面,scRNA-seq 数据的无监督聚类结果与传统细胞类型匹配度较高,但在更精细分辨率下,聚类结果与经典功能子集的对应关系并不理想,尤其在 T 细胞和 NK 细胞中表现明显。
- 转录组与功能关系及应对策略:T 细胞和 NK 细胞的转录组多样性受记忆和细胞毒性分化等生物学过程的强烈影响,导致基于转录组的聚类常依据效应功能而非经典谱系。此外,scRNA-seq 数据还存在细胞类型和细胞状态难以区分的问题。为解决这些问题,研究人员确定了多个诊断基因程序,如 S100A 蛋白表达、颗粒酶表达模式和 EDS 等,这些程序可作为 scRNA-seq 数据解读的重要补充,有助于更准确地理解免疫细胞的功能和状态。
- 研究局限性与展望:本研究的样本主要来自临床健康个体,未来应纳入更多炎症和激活状态的免疫细胞样本,以更全面地研究免疫系统。同时,其他非人灵长类动物的免疫细胞转录组也值得深入探究,以进一步完善对免疫细胞的认知。