
-
生物通官微
陪你抓住生命科技
跳动的脉搏
CanASM数据库:癌症等位基因特异性DNA甲基化的全面解析与调控网络构建
【字体: 大 中 小 】 时间:2025年07月10日 来源:BMC Genomics 3.5
编辑推荐:
研究人员针对癌症中遗传变异与表观调控的交互机制研究不足的问题,开发了首个专注于癌症等位基因特异性DNA甲基化(ASM)的综合数据库CanASM。该研究整合31种癌症的BS-Seq数据,鉴定5,003,877个SNV-CpG对,通过多维度注释揭示ASM在增强子、3D染色质互作等调控元件中的富集特征,为解析SNV驱动的癌症表观遗传调控提供关键资源。
在癌症研究领域,遗传变异与表观遗传调控的交叉作用一直是科学界关注的焦点。单核苷酸变异(SNV)通过影响DNA甲基化模式调控基因表达的现象被称为等位基因特异性DNA甲基化(ASM),这种机制在肿瘤发生发展中扮演重要角色。然而,现有数据库如Pancan-meQTL和ASMdb存在显著局限:仅覆盖有限癌症类型、缺乏系统性调控元件注释,且靶基因预测仅依赖基因组邻近性,忽视了远端调控的重要性。更关键的是,94.8%的ASM事件通过染色质远程互作发挥调控作用,这一重要特征在现有资源中未被充分体现。
针对这些空白,东北林业大学生命科学学院的研究团队开发了CanASM数据库。这项发表在《BMC Genomics》的研究,通过整合226个BS-Seq样本(覆盖31种癌症类型),系统鉴定了5,003,877个SNV-CpG对,包含3,056,776个索引SNV和4,157,508个CpG位点。研究创新性地将ASM与超级增强子(SE)、典型增强子、染色质开放区域(ATAC-seq)、绝缘子(CTCF)等六大类调控元件进行关联注释,并整合1,980个转录因子(TF)的ChIP-seq数据,构建了迄今最全面的癌症ASM调控图谱。
关键技术方法包括:1) 基于BS-SNPer和Fisher精确检验的ASM检测流程,处理来自30种组织的226个BS-Seq样本;2) 整合966个样本的1.21亿条3D染色质互作数据(HiChIP/ENCODE/4D Nucleome);3) 通过ANNOVAR、eQTL和空间互作三种策略预测靶基因;4) 应用atSNP算法分析SNV引起的TF结合亲和力变化。
研究结果主要体现在以下方面:
数据库内容
CanASM包含5,003,877个独特SNV-CpG对,其中89%的索引SNV位于典型增强子区域,47.8%位于超级增强子,55.9%与TF结合位点重叠。值得注意的是,通过3D互作预测发现94.8%的ASM呈现远端调控关系,远高于传统邻近调控(5.2%),凸显染色质空间组织在ASM调控中的核心地位。
功能特征
典型案例分析显示,肺癌风险SNP rs1883832的突变等位基因(C)与相邻CpG位点的超甲基化相关,该位点同时位于MYC和TP53BP1的TF结合域。3D互作分析揭示其通过染色质环化调控远端癌基因MMP9和UBE2C的表达,这些基因分别参与肿瘤转移和细胞周期调控。
技术优势
相比现有资源,CanASM的创新性体现在:1) 覆盖癌症类型增加35%(31 vs 23/8种);2) 首次整合多组学调控数据;3) 提供TF亲和力变化、细胞标志物关联等在线分析工具。例如,BCL6基因体区的rs1056932位点ASM模式与既往研究一致,证实该数据库的生物学可靠性。
研究结论强调,CanASM通过多组学整合和空间基因组学视角,突破了传统ASM研究的线性基因组局限。该资源不仅为解析SNV如何通过ASM影响癌症表观景观提供新范式,其发现的调控元件富集特征(如超级增强子区ASM富集)为开发靶向表观遗传疗法提供理论依据。数据库提供的三大分析工具——TF结合预测、3D靶基因推断和细胞标志物关联,将显著加速癌症驱动变异的功能解析。这项研究标志着癌症遗传-表观互作研究从单维度关联向多维调控网络分析的重要跨越。
生物通微信公众号
知名企业招聘