中国免疫组学多组学图谱

《SCIENCE》:Chinese Immune Multi-Omics Atlas

【字体: 时间:2026年01月10日 来源:SCIENCE 45.8

编辑推荐:

  Yin等对428名中国健康成人免疫细胞进行scRNA-seq和scATAC-seq分析,整合多组学数据揭示性别、年龄相关分子变异及遗传调控机制,构建237个增强子驱动基因调控网络,发现9600个e基因和52,361个ca峰,并开发CIMA-CLM模型预测染色质可及性,为免疫相关疾病研究提供资源。

  

编辑总结

单细胞分析相较于批量实验具有更高的分辨率,但在同一个体中评估多组学特征(尤其是对于非欧洲血统的个体)仍然较为罕见。Yin等人对428名健康中国人的免疫细胞进行了单细胞测序分析,包括RNA水平(scRNA-seq)和染色质可及性(scATAC-seq),并结合了基因分型、脂质及其他生化标志物。研究者分析了年龄和性别对这些结果的影响,整合了转录组和染色质数据以识别增强子-基因网络,并发现了与基因表达和染色质可及性相关的遗传变异。这一图谱将为研究免疫细胞生物学提供重要资源。——Corinne Simonti

结构化摘要

引言

理解驱动人类免疫变异的遗传调控机制对于阐明免疫介导疾病的易感性至关重要。单细胞基因组学的发展提供了必要的分辨率,能够详细解析这些遗传因素在免疫系统各类型细胞及特定环境中的调控作用。

研究背景

要深入理解免疫变异及免疫介导疾病的机制,需要将转录组数据与表观基因组信息相结合,以揭示非编码变异对染色质的影响。然而,目前外周血单核细胞(PBMCs)的大规模单细胞测序(尤其是针对转座酶可及性染色质的scATAC-seq)数据集较为稀缺,且现有资源主要集中在欧洲血统的个体上。因此,我们构建了“中国免疫多组学图谱”(CIMA),旨在填补这一研究空白,为研究中国人群免疫系统的调控机制提供基础支持。

研究结果

通过使用单细胞RNA测序(scRNA-seq)和scATAC-seq技术,我们对428名中国人的10,247,216个PBMCs进行了分析。通过迭代聚类和层次化注释,识别出了73种具有不同转录特征的免疫细胞类型,从而系统地分析了与性别和年龄相关的分子变异。我们利用scATAC-seq绘制了338,036个潜在的顺式调控元件(cCREs),并将这些染色质图谱与scRNA-seq数据整合,构建了增强子驱动的基因调控网络(GRNs),将84,625个调控区域与13,645个目标基因关联起来。此外,我们还发现了与细胞类型和年龄相关的GRNs,揭示了免疫细胞中的关键转录因子(TFs)。
通过结合单细胞数据与全基因组测序(WGS)数据,我们进行了细胞类型特异性的数量性状位点(xQTL)分析,识别出9,600个eGenes和52,361个caPeaks,并在单核细胞和B细胞中检测到了动态表达的数量性状位点(eQTLs)。将这些xQTL结果与全基因组关联研究(GWAS)的统计结果整合后,我们在68种免疫细胞类型中发现了1,196个显著的基于汇总数据的孟德尔随机化(SMR)关联;其中73.2%的关联仅在一个细胞类型中显著。我们发现了细胞类型特异性和共享的多效性关联,这些关联将遗传变异与染色质可及性、基因表达、炎症相关循环蛋白及疾病风险联系起来。例如,rs34415530这一变异通过影响CD4+ FOXP3+调控T细胞中的IKZF4表达,表现出多效性效应,既影响循环白细胞介素-12B(IL-12B)的水平,又影响哮喘的易感性。最后,我们开发了CIMA-CLM这一细胞类型特异性语言模型,该模型能够准确预测不同细胞类型的染色质可及性,并与实验结果高度一致。体外突变实验也证实了其在评估非编码变异效应方面的实用性。

结论

CIMA提供了一个全面的人口规模免疫多组学资源,揭示了免疫系统的细胞类型特异性调控机制。我们的研究为深入理解人类免疫多样性及免疫介导疾病的遗传基础提供了框架。
CIMA:一个关于中国人群的全面免疫多组学图谱。
通过对428名中国人的1,000多万个循环免疫细胞进行多组学分析,我们揭示了它们的分子和细胞特性。细胞类型特异性的xQTL分析定位了数千个eGenes和caPeaks。结合GWAS数据的SMR分析揭示了遗传变异与免疫介导疾病之间的细胞类型特异性关联。此外,我们还构建了细胞语言模型CIMA-CLM来预测染色质可及性。ILC代表先天淋巴细胞;HSPC代表造血干细胞和前体细胞;TF代表转录因子;Treg代表调节性T细胞;DC代表树突状细胞。

摘要

人类外周血在不同人群中存在分子和细胞异质性,但其背后的机制仍不明确。我们通过对中国428名成年人的1,000多万个循环免疫细胞进行多组学分析,构建了“中国免疫多组学图谱”(CIMA),揭示了与性别、年龄和遗传变异相关的分子变异。CIMA确定了由增强子驱动的基因调控网络(包含237个关键调控元件),在细胞类型层面识别出了9,600个eGenes和52,361个caPeaks,并发现了免疫相关疾病风险位点、顺式表达数量性状位点(QTLs)与染色质可及性QTLs之间的多效性关联。此外,CIMA-CLM语言模型能够预测染色质可及性,并评估了非编码变异对染色质序列和基因表达的影响。CIMA为免疫相关疾病研究提供了全面的参考依据。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号