编辑推荐:
为探究鸡感染柔嫩艾美耳球虫(E. tenella)的机制,湖南农业大学的研究人员开展鸡盲肠单细胞转录组研究,构建细胞图谱,揭示感染时细胞变化。该研究对家禽健康及相关疾病研究意义重大,推荐科研读者阅读。
湖南农业大学(College of Animal Science and Technology, Hunan Agricultural University)的研究人员 Jun-Hao Tu、Bo-Gong Liu 等人在《BMC Genomics》期刊上发表了题为 “Single?cell transcriptomic atlas of the chicken cecum reveals cellular responses and state shifts during Eimeria tenella infection” 的论文。这篇论文对于家禽健康和生产力提升、鸡肠道疾病研究等领域有着重要意义,为深入了解鸡盲肠细胞结构以及球虫感染机制提供了关键依据,也为后续相关研究搭建了宝贵的框架。
研究概述
该研究通过 10X Genomics 单细胞 RNA 测序(scRNAseq)技术,构建了鸡盲肠上皮的单细胞图谱,并结合感染艾美耳球虫(Eimeria tenella,E. tenella)鸡的批量 RNAseq 数据进行分析,揭示了感染过程中细胞类型组成和状态的变化,以及细胞间通信网络的改变。
研究背景
鸡球虫病是一种普遍存在的寄生原虫病,严重影响家禽产业,给养殖户带来巨大的经济损失。E. tenella 作为主要的球虫病原体,通常会定植在鸡的盲肠中,破坏盲肠上皮细胞连接的稳定性。它会通过附着相关蛋白入侵宿主细胞,还能诱导宿主细胞凋亡,影响上皮完整性,并且有研究表明其感染会引发盲肠上皮细胞自噬。同时,球虫感染还会对盲肠内的免疫细胞,尤其是 T 细胞产生影响。由于肠道上皮屏障由多种细胞协同构成,结构和功能复杂,因此构建鸡盲肠单细胞图谱对于深入了解球虫感染的致病机制至关重要。
虽然单细胞 RNA 测序(scRNA-seq)是一种强大的研究细胞类型的技术,但 RNA-seq 从批量组织样本中无法区分细胞异质性对基因表达的影响,且大规模 scRNA-seq 成本高昂。不过,整合同一组织的 scRNA-seq 和批量 RNA-seq 数据已成为可行的研究方法,能够揭示细胞比例和状态的变化。此前,这种整合分析在癌症研究中已成功应用,但在动物研究领域,尽管有批量 RNA-seq 数据可用,且对农场动物机制研究具有重要经济意义,但 scRNA-seq 技术的应用仍较为有限。
研究方法
- 鸡盲肠单细胞样本制备和测序:研究人员从 90 日龄的一只雄性和一只雌性中国地方黄羽鸡中采集盲肠样本,这些鸡均确认未感染 E. tenella。所有动物实验程序都经过湖南农业大学动物护理和使用伦理委员会批准。采集样本后,严格评估细胞活力,仅处理活细胞率超过 90% 的样本。合格细胞经过清洗和重悬,使其浓度达到每微升 700 - 1200 个细胞,以满足 10X Genomics ? Chromium 系统的要求。接着制备 cDNA 文库,并进行 PCR 扩增,确保文库的最佳代表性。扩增后的文库经过片段化处理,在 Illumina NovaSeq 6000 平台上进行测序,目标是每个细胞的测序深度超过 50,000 读对,以保证全面覆盖转录组。
- scRNA-seq 数据处理和分析:原始数据利用 Cellranger 软件(版本 7.1.0),通过唯一分子标识符(UMIs)处理生成计数矩阵,用于准确的转录本定量。使用 R 包 Seurat(版本 4.4.0)对表达矩阵进行归一化处理得到计数值。然后对细胞进行筛选,排除基因表达少于 200 个或多于 4,000 个的细胞,以及线粒体基因表达百分比高于 10% 的细胞。仅保留在超过三个细胞中表达的基因用于进一步分析。为了更精细地处理数据,研究人员识别出每个细胞中前 2,000 个高可变基因用于下游分析。采用主成分分析(PCA)进行降维,使用前 14 个主成分。在分辨率为 0.5 的条件下进行细胞聚类,并利用均匀流形近似和投影(UMAP)在二维空间中可视化细胞聚类结果,展示细胞类型的异质性和细胞轨迹。
- 细胞类型注释:利用 R 包 Seurat 识别差异表达基因(DEGs),通过比较特定聚类中的细胞与所有其他聚类中的细胞的基因表达来确定。将在至少 25% 的聚类细胞中表达的基因纳入 DEG 分析。标记基因被定义为在目标细胞类型中高表达且在不同细胞类型中表达差异明显的基因。研究人员根据已有的公开数据库和文献中标记基因的证据手动注释细胞类型,对于标记基因证据有限的聚类,则根据标记基因的生物学功能或与已知细胞类型的转录组相似性进行注释。
- RNA-seq 数据处理和分析:从基因表达综合数据库(GEO)中检索转录组数据(GSE160169)。该数据集包含 36 只迪卡白来航型母鸡,分为未感染对照组和 5 个实验组,实验组在 17 日龄时口服接种 1,000 个活的 E. tenella 卵囊,每组 6 个重复。在感染后的 5 个不同时间点(1 dpi、2 dpi、3 dpi、4 dpi 和 10 dpi)收集 6 只感染鸡和 1 - 2 只未感染鸡的盲肠样本。RNA-seq 数据使用 fastp(版本 0.20.1)进行质量控制,去除测序接头和低质量读段。然后使用 HISAT2(版本 2.2.1)将清洗后的读段与鸡参考基因组(GRCg7b)进行比对。利用 Subread 包(版本 1.6.3)中的 featureCounts 获得基因水平的读段计数,并归一化为每百万转录本(TPM),以便后续分析。
- 差异基因表达分析:使用 DESeq2 包(版本 1.36.0)进行差异基因表达分析。同时应用线性回归模型,以考虑细胞比例对表达水平的影响。当基因的调整 P 值小于 0.05 且 | log?(倍数变化)| 大于 2 时,则认为该基因显著差异表达。利用 R 中的 clusterProfiler 包(版本 4.7.1.3)对差异表达基因(DEGs)进行基因本体(GO)和京都基因与基因组百科全书(KEGG)通路注释和富集分析。
- 细胞分化和发育轨迹分析:使用 CytoTRACE 评估和分析每个盲肠细胞类型的分化潜能,通过比较不同细胞类型的分化指数来推断它们的发育潜能和相对分化状态。利用 Monocle3 包(版本 1.3.4)中的伪时间算法分析 APOB 肠上皮细胞的发育轨迹,以了解细胞分化过程中潜在的分子变化顺序。
- 细胞 - 细胞通信分析:使用 BabelGene(版本 22.9)识别鸡与人之间的直系同源基因,然后利用 R 包 CellChat 基于 CellChatDB 的信息进行细胞 - 细胞通信分析。
- 单细胞 RNAseq 数据模拟和反卷积:利用 CIBERSORT 算法对批量转录组数据进行反卷积,以估计相对细胞组成。为了验证该方法的准确性,研究人员首先使用 R 包 SimBu 从单细胞 RNA-seq 数据中创建伪批量样本。具体来说,模拟了 100 个具有预定义细胞比例的伪批量 RNA-seq 样本,并通过计算反卷积得到的细胞百分比与真实细胞百分比之间的 Spearman 相关系数来严格评估反卷积的准确性。此外,为了确定不同细胞状态下 APOB?肠上皮细胞的丰度,研究人员将 R 包 MeDuSA 与 Monocle3 分析得到的伪时间轨迹数据进行整合。
- 统计分析:使用 R 软件(版本 4.2.0)进行包括方差分析(ANOVA)和多重检验校正在内的统计分析。对细胞比例数据进行反正态变换以进行归一化处理。使用置换 F 检验评估细胞状态丰度的统计显著性,设定 P < 0.05 为具有统计学意义的阈值。
研究结果
- 鸡盲肠上皮细胞图谱:研究人员从一只雌性和一只雄性鸡的盲肠中生成了单细胞转录组数据,经过质量控制后获得 7,394 个细胞。利用 Harmony 方法校正了性别和批次效应,通过 UMAP 方法在二维空间中可视化细胞转录组相似性,共识别出 13 个不同的细胞簇,并将每个簇注释为一种细胞类型。这些细胞类型主要分为免疫细胞和上皮细胞两类。免疫细胞包括 B 细胞(标记基因 EBF1、PAX5)、树突状细胞(CD74、IFI30、NAAA)、初始 T 细胞(CD3E、TCF7、LEF1)、增殖性 T 细胞(CD3E、SMC2、TOP2A、HMGN4)、T 细胞(CD3E、GNLY、IL20RA、PLCL1)以及特定的 T 细胞亚群,如 GZMA? T 细胞(GZMA、GNLY)、RORA? T 细胞(CD3D、RORA)和 CCL20 T 细胞(CD3E、CCL20、PTH2R、KCNQ1)。上皮细胞包括 FABP1/2 肠上皮细胞(APOA1、FABP1、FABP2)、APOB 肠上皮细胞(APOA1、APOB)、杯状细胞(MUC2、FER1L6、MAP2)和簇状细胞(TRPM5、DCLK1、EHF),同时还在鸡盲肠中鉴定出少量红细胞(HBBA、HBA1、HBAD)。
对每种细胞类型的前 20 个细胞类型特异性基因进行 GO 富集分析,结果显示成熟 T 细胞在免疫相关通路中富集,初始 T 细胞在免疫相关通路以及细胞分化和细胞周期相关通路中富集。肠上皮细胞在碳水化合物合成和消化代谢相关通路中富集,红细胞则与氧代谢过程相关。整体上,盲肠上皮细胞的细胞分化能力比免疫细胞更强。研究还发现,除红细胞和初始 T 细胞外,所有盲肠细胞类型之间都存在广泛的细胞 - 细胞通信。
- APOB 肠上皮细胞在 E. tenella 感染后的细胞比例和细胞阶段变化:研究人员对 36 个来自 E. tenella 感染研究的盲肠样本的批量 RNA-seq 转录组数据进行反卷积分析。首先利用 SimBu 软件生成模拟单细胞 RNA-seq 数据,结果显示模拟的细胞比例与反卷积结果之间具有很强的相关性(Spearman’s r2 = 0.83 - 0.99),这证明了研究方法和单细胞 RNA-seq 图谱在反卷积鸡盲肠批量 RNA-seq 数据方面的可行性和准确性。
通过整合盲肠单细胞 RNA-seq 数据,研究人员估计了 36 个批量 RNA-seq 样本中 13 种不同细胞类型的相对比例。其中,APOB?肠上皮细胞、增殖性 T 细胞和树突状细胞的相对比例较高(中位数大于 0.1)。在不同组之间,细胞比例存在显著的异质性,但在感染后 3 天(dpi)之前,大多数细胞类型与未感染组相比没有明显变化。值得注意的是,APOB 肠上皮细胞的相对比例在 3 - 4 dpi 显著下降约 22%,在 4 - 10 dpi 进一步下降约 19%。相反,增殖性 T 细胞的比例在 3 - 4 dpi 和 4 - 10 dpi 分别显著增加 8% 和 16%。树突状细胞的比例在 3 - 4 dpi 显著增加约 10%,在 4 - 10 dpi 保持稳定。
为了进一步研究 APOB?肠上皮细胞的细胞状态变化,研究人员进行了伪时间分析,揭示了这些细胞的轨迹,并定义了三个不同的阶段:state_1、state_2 和 state_3。利用 MeDuSA 评估不同 RNA-seq 样本中这三个阶段 APOB?肠上皮细胞的丰度。结果发现,与未感染组相比,3 dpi 时三个阶段的 APOB 肠上皮细胞丰度没有显著变化。然而,在 10 dpi 时,stage_1 的相对丰度没有显著变化(P = 0.099),stage_2 显著增加(P < 0.05),stage_3 显著减少(P < 0.05)。
对三个阶段的 APOB?肠上皮细胞进行差异基因表达分析和 KEGG 通路富集分析发现,stage_1 的基因主要富集在细胞黏附通路(如黏着连接和焦点黏附)和细胞生长通路(如 GnRH 信号和 Wnt 信号)。stage_2 的 APOB 肠上皮细胞除了表达与细胞连接和生长通路相关的基因外,还在细胞死亡相关过程(如吞噬凋亡细胞和细胞衰老)中富集。stage_3 的 APOB 肠上皮细胞则在线粒体功能(如氧化磷酸化、谷胱甘肽代谢和细胞色素 P450 相关通路)和细胞质功能(如过氧化物酶体、糖酵解 / 糖异生和核糖体代谢)方面富集。
- E. tenella 感染下细胞通信的变化:为了研究 E. tenella 感染如何影响鸡盲肠上皮不同细胞类型之间的相互作用,研究人员基于批量 RNA-seq 数据构建了细胞通信图谱。由于传统批量 RNA-seq 数据可能忽略组织中细胞类型混合的影响,研究人员使用两种不同的回归模型进行差异表达分析:一种考虑细胞比例,另一种不考虑。结果显示,考虑细胞比例的回归模型显著提高了差异表达基因(DEGs)的检测能力。具体来说,该模型在比较未感染组和 1 dpi 组的基因表达谱时,识别出 177 个新的 DEGs,而未考虑细胞比例的模型则未检测到任何 DEGs。总体而言,与未考虑细胞比例的模型相比,考虑细胞比例的模型多检测到 6,861 个 DEGs。
考虑细胞比例的回归模型识别出的 DEGs 在多个 KEGG 通路中富集,其中 WNT 信号通路(KEGG: hsa04310)、细胞因子 - 细胞因子受体相互作用(KEGG: hsa04060)和神经活性配体 - 受体相互作用(KEGG: hsa04080)显著(P < 0.05),并且在基于 scRNA-seq 数据的 CellChat 分析的配体 - 受体相互作用中也被观察到。研究人员进一步研究了这些 KEGG 通路的细胞通信网络,重点关注不同盲肠细胞类型之间的配体 - 受体相互作用。在 ncWNT 通路中,簇状细胞是 APOB 肠上皮细胞和簇状细胞自身的唯一配体来源。在 CCL 通路中,RORA T 细胞和 CCL20 T 细胞既发送又接收配体。在 RANKL 通路中,RORA? T 细胞和 CCL20 T 细胞分别单向地向杯状细胞、APOB?肠上皮细胞和树突状细胞发送配体。在 PARs 通路中,GZMA? T 细胞、增殖性 T 细胞和 T 细胞向杯状细胞、APOB?肠上皮细胞、簇状细胞和树突状细胞发送配体。
对 RNAseq 数据中配体和受体表达的分析表明,在不同感染阶段,它们的表达水平发生了显著变化。在 ncWNT 通路中,与未感染组相比,10 dpi 时配体表达显著增加,而受体表达下降。在 CCL 通路中,3 dpi 和 4 dpi 时配体表达显著增加,受体表达下降,但在 10 dpi 时趋势相反,配体表达下降,受体表达增加。在 RANKL 通路中,与未感染组相比,仅在 10 dpi 时配体表达显著增加。在 PARs 通路中,1、2、3 和 4 dpi 时配体表达显著增加,10 dpi 时急剧增加,而受体表达保持不变。
研究结论与讨论
研究人员通过构建鸡盲肠上皮单细胞图谱,全面揭示了 E. tenella 感染过程中细胞的变化情况。研究共鉴定出 13 种不同的细胞类型,详细描述了它们的基因表达谱和通信网络。E. tenella 感染导致盲肠细胞组成发生显著变化,APOB 肠上皮细胞显著减少,增殖性 T 细胞增加,这反映了寄生虫对上皮完整性和免疫激活的影响。对 APOB?肠上皮细胞的细胞轨迹分析发现,感染后细胞状态发生了明显转变,与细胞死亡相关的功能增加,而与线粒体和细胞质保护相关的功能减少,突出了 E. tenella 对盲肠营养吸收和能量代谢的有害影响。
此外,通过整合单细胞和批量转录组数据,研究人员展示了这种方法在揭示宿主 - 病原体相互作用复杂性方面的优势。传统批量 RNA-seq 数据的差异基因表达分析往往无法考虑细胞类型的异质性,而本研究通过在回归模型中纳入细胞比例信息,显著提高了差异表达基因的检测能力。研究中发现的 KEGG 通路,如 Wnt 信号通路、RANKL 和 PARs 通路,与 E. tenella 感染引起的细胞变化密切相关,这为深入理解感染机制提供了重要线索。
这项研究成果为理解鸡盲肠的细胞结构提供了关键资源,为未来研究盲肠疾病的病理生理学和盲肠的代谢功能搭建了有价值的框架,有望在改善家禽健康和提高生产力方面发挥重要作用。不过,研究也存在一定的局限性,未来的研究可以进一步纳入 E. tenella 感染盲肠样本的单细胞转录组数据,以验证和深入探索这些发现。