单细胞多组学整合揭示胃癌与结直肠癌亚克隆的染色体不稳定性与转录表型关联
《NAR Genomics and Bioinformatics》:Single-cell aneuploidy and chromosomal arm imbalances define subclones with divergent transcriptomic phenotypes
【字体:
大
中
小
】
时间:2025年11月01日
来源:NAR Genomics and Bioinformatics 2.8
编辑推荐:
本研究针对肿瘤内异质性中亚克隆基因型与表型关联难以解析的问题,开发了scAlign计算框架,整合单细胞DNA测序(scDNA-seq)和RNA测序(scRNA-seq)数据,首次在胃癌和结直肠癌中系统揭示了由非整倍体和染色体臂失衡定义的亚克隆具有 divergent 转录表型。研究人员通过分析8例患者16个样本的8851个scDNA-seq细胞和58351个scRNA-seq细胞,发现G0/G1期上皮细胞的整合分析能准确表征亚克隆结构,并鉴定出MYC信号通路、干扰素反应等关键表型差异,为理解肿瘤进化提供了新视角。
癌症如同一座复杂的城市,其中居住着基因组特性各不相同的细胞群体,这些被称为亚克隆的细胞群体共同构成了肿瘤的异质性景观。传统上,科学家们通过染色体非整倍体、臂失衡和大片段拷贝数变异(CNV)等基因组不稳定性事件来定义这些亚克隆。然而,单靠DNA测序难以揭示这些基因变化如何影响细胞的生物学行为,而单细胞RNA测序虽然能提供丰富的转录组信息,却在检测基因组不稳定性事件方面精度有限。这种基因型与表型之间的"失联"成为理解肿瘤进化的关键瓶颈。
为了解决这一难题,斯坦福大学的研究团队在《NAR Genomics and Bioinformatics》上发表了创新性研究成果。他们开发了名为scAlign的计算框架,首次实现了对同一肿瘤样本的单细胞DNA和RNA测序数据的有效整合,使得在单细胞分辨率下同时解析亚克隆的基因组特征和转录表型成为可能。
研究人员主要运用了单细胞DNA测序(scDNA-seq)技术进行全基因组拷贝数变异分析,单细胞RNA测序(scRNA-seq)技术进行转录组分析,以及自主开发的scAlign算法进行多组学数据整合。研究纳出来自8例患者的16个样本,包括3例原发性胃癌和5例结直肠癌(CRC)及其转移灶,通过细胞周期分选聚焦G0/G1期细胞以提高分析准确性。
研究团队首先建立了基于全基因组CNV差异的细胞周期分类方法,发现G0/G1期肿瘤细胞表现出稳定一致的CNV谱,而S期细胞因DNA复制过程呈现动态变化。通过高斯混合模型分析,他们成功将细胞分为二倍体、G0/G1期和S期群体。特别值得注意的是,S期细胞的CNV值约为G0/G1期的两倍,这与DNA复制动力学完全吻合。在肿瘤样本中,G0/G1期细胞占约25%,其染色体不稳定性(CIN)水平显著低于S期细胞,为后续亚克隆分析提供了理想材料。
研究人员详细分析了胃癌和结直肠癌中的非整倍体、染色体臂失衡和大片段CNV事件。原发性胃癌中,1-5Mb的CNV片段约占所有非整倍体事件的30%。与TCGA数据库比较发现,两种癌症在7号染色体(p,q臂)、8q臂和20号染色体(p,q臂)的扩增以及21q臂的缺失等方面表现出高度一致性。结直肠癌中,扩增事件频率显著高于缺失,特别是在P6461和P6198肝转移灶中,扩增事件比例分别高达88.0%和89.7%。
以P5931胃癌为例,研究人员通过聚类分析鉴定出四个主要亚克隆(C1-C4)。C1-C3亚克隆由7、8和21号染色体的不平衡共同定义,而C4亚克隆则通过2号和3号染色体的特异性扩增与其他亚克隆区分。系统进化树分析显示,这些亚克隆与二倍体正常细胞在进化距离上存在明显差异,反映了肿瘤的进化历程。
在结直肠癌转移灶中,研究人员同样观察到复杂的亚克隆结构。P6198肝转移灶包含两个亚克隆,其中C1亚克隆表现为17条染色体的全面扩增,而C2亚克隆在12号染色体上保持二倍体状态。P6335大网膜转移灶则显示出三个亚克隆,通过3号和11号染色体的不同失衡模式相互区分。
特别有趣的是对匹配的原发灶和转移灶的分析。在P6461患者中,原发结肠癌包含五个亚克隆,而肝转移灶仅检测到一个亚克隆。系统进化分析表明,转移灶亚克隆与原发灶中的C1亚克隆亲缘关系最近,共同享有7、8、14和20号染色体的扩增特征,但转移灶表现出更广泛的全染色体非整倍性。
研究团队开发的核心算法scAlign通过投影映射方法,基于基因剂量效应原理将scRNA-seq中的上皮细胞精确分配到scDNA-seq定义的亚克隆中。该算法通过最小化损失函数,计算每个基因的最优投影因子βk,将scRNA-seq数据映射到CNV空间。验证分析显示, inferred CNV与scDNA-seq结果的相关性系数达0.72-0.86,显著优于随机分配。
与Clonealign和相关分析方法相比,scAlign在多个样本中表现出更高的整合准确性。在P5931样本中,scAlign在C1、C2和C3亚克隆中的相关性分别达到0.72、0.86和0.81。即使在外部卵巢癌数据集验证中,scAlign也表现出与Clonealign相当的亚克隆识别能力(调整兰德指数分别为0.85和0.86)。
差异表达分析揭示了各亚克隆独特的转录特征。P5847胃癌中,C1亚克隆伴随7号染色体扩增显示TFF3和OLFM4基因高表达,而C2亚克隆因8号染色体扩增导致MYC癌基因过度表达。通路富集分析进一步显示,C2亚克隆中MYC信号通路活性显著增强。
在结直肠癌中,研究人员观察到类似的亚克隆特异性表达模式。P6335大网膜转移灶中,C3亚克隆表现出干扰素-α、干扰素-γ反应和TNFA/NFKB信号通路的显著激活。这些通路与免疫逃逸和肿瘤进展密切相关。
对匹配样本的分析揭示了原发灶与转移灶之间的重要差异。在P6593患者中,肝转移灶表现出干扰素反应通路的特异性激活,这在原发灶亚克隆中未见。此外,P6461患者的原发灶C4亚克隆和转移灶都显示MYC信号通路激活,提示该通路在转移过程中的重要作用。
这项研究通过创新的多组学整合方法,成功破解了肿瘤亚克隆基因型与表型之间的关联密码。研究发现不仅证实了染色体不稳定性在肿瘤进化中的核心地位,还揭示了亚克隆特异性通路活性对肿瘤表型的塑造作用。特别值得注意的是,转移灶往往起源于原发灶中非整倍体程度最高的亚克隆,且表现出独特的免疫相关通路活性,这为理解肿瘤转移机制提供了重要线索。scAlign计算框架的建立为单细胞多组学研究提供了强大工具,有望在更广泛的癌症类型中揭示肿瘤异质性的奥秘。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号