混合模型与转录组关联分析揭示结直肠癌易感性的转录因子调控网络与风险基因

《Nature Communications》:Mixed-model and transcriptome-wide association analyses identify transcription factors and genes associated with colorectal cancer susceptibility

【字体: 时间:2026年01月16日 来源:Nature Communications 15.7

编辑推荐:

  本研究针对结直肠癌(CRC)遗传易感性机制不清的问题,通过整合218个转录因子(TF)ChIP-seq数据与多祖先GWAS数据(100,204例患者和154,587例对照),采用广义线性混合模型(GLMM)和sTF-TWAS方法,系统鉴定出51个CRC风险相关TF及222个风险基因(含95个新基因)。实验验证证实TXN、IRS2和RHPN2的致癌功能,单细胞分析提示44.6%的基因参与CRC演进,并发现48个潜在可成药靶点(如PARP11、PKM)。该研究为CRC精准防治提供了新靶点和网络调控见解。

  
结直肠癌是全球高发恶性肿瘤,其遗传机制复杂,尽管全基因组关联研究(GWAS)已发现超过250个风险位点,但多数变异位于非编码区,如何解析这些变异通过调控基因表达影响癌症风险的机制仍是挑战。转录因子(TF)作为基因表达的关键调控者,其结合活性受遗传变异影响,可能成为破解癌症易感性的突破口。然而,传统方法统计效力有限,且跨祖先人群的转录组研究数据匮乏,阻碍了对结直肠癌遗传基础的深入理解。
为系统揭示TF调控网络在结直肠癌中的作用,由Zhishan Chen、Wenqiang Song、Qing Li等共同第一作者,Xingyi Guo通讯作者领衔的国际团队,在《Nature Communications》发表最新研究。团队整合218个TF染色质免疫沉淀测序(ChIP-seq)数据集与大规模多祖先GWAS数据(含东亚和欧洲人群共10万余病例、15万余对照),采用广义线性混合模型(GLMM)识别风险相关TF,并基于sTF-TWAS框架整合转录组、可变剪接(AS)和选择性多聚腺苷酸化(APA)数据,构建多组学风险基因图谱。
关键技术方法
研究利用结肠组织RNA-seq数据(364例东亚人群、707例欧洲人群),通过弹性网络算法构建基因表达、AS和APA预测模型,结合GLMM分析TF结合位点与GWAS信号的关联,采用条件分析验证基因独立性,并通过单细胞RNA测序(scRNA-seq)分析基因在CRC演进中的表达动态,最后通过CRISPR/Cas9基因敲除和功能实验验证候选基因的致癌作用。
风险转录因子的鉴定与调控网络
通过GLMM分析,研究鉴定出51个与CRC风险显著相关的TF(如VDR、MYC、JUN等),其中40个TF经分层连锁不平衡评分回归(S-LDSC)验证。Motif富集分析显示这些TF的结合区域显著富集其自身DNA结合 motif(如VDR motif富集度达24.2%)。进一步分析发现154对TF存在协同作用,其中VDR是核心互作因子,提示TF共结合区域可增强风险变异效应。
多组学TWAS揭示新型风险基因
sTF-TWAS分析识别出140个通过基因表达关联CRC的基因(含41个新基因),AS-WAS和APA-WAS分别发现85个和33个风险基因。整合分析共确定222个独特风险基因,其中95个为首次报道。值得注意的是,COLCA2、METRNL、ARPC5和COX14在三种分析中均被检出,提示其多层面调控重要性。条件分析显示,39个已知基因独立于邻近GWAS信号,表明其直接致病潜力。
单细胞解析基因的病理演进角色
通过分析结肠正常组织、锯齿状息肉、腺瘤和癌组织的scRNA-seq数据,研究揭示99个风险基因(占44.6%)在CRC演进路径中显著差异表达。例如,在"正常-锯齿状息肉-癌"路径中,48个基因在特定细胞类型(如吸收细胞、干细胞)中表达异常,为基因功能提供细胞语境证据。
致癌基因实验验证与成药性分析
选择TXN、IRS2和RHPN2进行CRISPR/Cas9敲除验证。Western blot证实敲除效率(蛋白降低34%-98%),功能实验显示TXN敲除显著抑制三种CRC细胞系(HCT116、RKO、SW480)的增殖和克隆形成;IRS2敲除主要影响长期克隆形成能力;RHPN2敲除在RKO和HCT116中抑制生长,但在SW480中效应较弱,体现细胞系依赖性。此外,通过整合DrugBank、ChEMBL等数据库,发现48个风险基因(21.6%)为潜在成药靶点,其中9个基因(如DDR1、SIK2)已有针对CRC的125种药物(已获批或临床试验阶段)。
结论与意义
本研究通过创新性整合GLMM与多组学TWAS,构建了结直肠癌遗传易感性的TF-基因调控网络,不仅揭示VDR等关键TF的调控作用,还发现大量新型风险基因(如TXN、IRS2)及其在癌细胞演进中的动态表达模式。实验验证强化了基因的生物学功能,而成药性分析为转化医学提供资源。该研究深化了对CRC遗传架构的理解,为精准预防和靶向治疗开辟了新路径。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号