《Naunyn-Schmiedeberg's Archives of Pharmacology》:Identification of circadian rhythm-related genes in colorectal cancer by integrating bioinformatics and multi-omics mendelian randomization
编辑推荐:
为明确昼夜节律与结直肠癌(CRC)的因果关联,研究人员整合了血液mQTL、eQTL、pQTL和GWAS数据,应用多组学孟德尔随机化(SMR)框架。研究发现GRHPR基因是关键的CRC风险降低因子,NAF1和ZNF365则是兼具风险分层与预后评估潜力的生物标志物,为理解CRC发病机制和开发新疗法提供了新线索。
想象一下,你体内有一台精密的生物钟,它指挥着睡眠、饮食、激素分泌等无数生理活动,这便是昼夜节律。已有大量流行病学观察发现,长期熬夜、倒班等扰乱“生物钟”的行为,与结直肠癌(Colorectal Cancer, CRC)发病风险升高密切相关。然而,这种关联仅仅是“伴随发生”,还是确实存在“前因后果”的驱动关系?其背后具体的分子机制又是什么?长久以来,这些问题一直悬而未决。要理清复杂的因果关系,传统的观察性研究容易受到混杂因素和反向因果的干扰。为了攻克这一难题,一项创新性的研究应运而生,它将前沿的遗传学统计工具与多层面的分子数据相结合,试图在纷繁复杂的生命现象中,抽丝剥茧,寻找那根最根本的因果之线。该研究成果已发表在《Naunyn-Schmiedeberg's Archives of Pharmacology》期刊上。
为了回答昼夜节律相关基因是否与CRC存在因果关系这一核心问题,研究人员采用了一套严谨的多组学孟德尔随机化(Multi-omics Mendelian Randomization, MR)分析框架。其技术路径的核心是利用来自不同公共数据库的遗传变异数据作为工具变量。首先,研究人员从KEGG、GO和GeneCards数据库整合了593个与昼夜节律相关的基因。关键的暴露数据(即可能的原因)来源于三个层面的血液定量性状位点:DNA甲基化位点(mQTL)、基因表达水平(eQTL)和蛋白质丰度(pQTL)。结局数据(即结果)则来自包含大量样本的芬兰人基因组研究(FinnGen R12)的CRC全基因组关联研究(GWAS)汇总数据。研究采用的主要方法是基于汇总数据的孟德尔随机化(Summary-data-based Mendelian Randomization, SMR)分析,并结合了共定位(colocalization)分析以增强因果推断的可靠性。最后,利用癌症基因组图谱(TCGA)和GEPIA2数据库对筛选出的候选基因进行了表达差异和预后价值的验证。整个研究设计逻辑清晰,旨在从遗传层面、多分子维度系统性地评估昼夜节律基因对CRC风险的因果影响。
MR analyses linking blood molecular QTLs to CRC risk(血液分子QTLs与CRC风险的MR分析)
研究人员首先在血液水平进行了SMR分析。在基因表达层面,发现了11个与CRC风险显著相关的基因。其中8个基因(如CCDC12, UVSSA, ZNF365)的高表达与CRC风险升高正相关,而3个基因(CPNE8, GRHPR, NAF1)则表现为负相关,即可能具有保护作用。通过共定位分析进一步证实,GRHPR, PLCL1和ZNF365这三个基因与CRC共享潜在的因果遗传变异。在DNA甲基化层面,筛选出142个与CRC相关的甲基化位点,其中42个位点得到了共定位证据的支持。值得注意的是,PLCL1, ZNF365, GRHPR和CCDC12四个基因在表达和甲基化分析中均被识别。在蛋白质层面,分析发现GRHPR和HLA-A两种蛋白质的丰度与CRC风险相关,且都有强共定位证据。综合三个分子层面,GRHPR是唯一一个在mQTL、eQTL和pQTL分析中均与CRC显著相关且得到共定位支持的基因,凸显了其关键地位。
Multi-omics integration reveals potential causal mechanisms(多组学整合揭示潜在因果机制)
通过整合多组学数据,研究深入探讨了GRHPR基因的潜在调控通路。曼哈顿图和效应图显示,GRHPR在甲基化、表达和蛋白水平上与CRC风险的关联信号在基因组位置上高度一致。进一步的分析提示,特定CpG位点(如cg14519323)的甲基化水平可能正向调控GRHPR基因的表达,而高表达的GRHPR又与其较高的蛋白质水平相关,最终导致CRC风险降低。虽然某些分析中出现了复杂的连锁不平衡结构,但多组学信号的一致性支持了一个假设:cg14519323位点的低甲基化可能抑制GRHPR表达,从而增加CRC风险。
Tissue-specific validation results(组织特异性验证结果)
为了增强发现的普适性,研究使用了结肠组织(乙状结肠和横结肠)特异性的eQTL数据进行验证。结果证实,在结肠组织中,GRHPR基因的高表达同样与较低的CRC风险相关,而UVSSA的高表达则与较高的风险相关。这支持了血液中发现的关键基因与CRC之间的因果关系在靶器官(结肠)中依然成立。
TCGA database explores key gene expression(TCGA数据库探索关键基因表达)
研究利用TCGA结直肠腺癌(COAD)队列的转录组数据,检查了12个候选基因在肿瘤组织与癌旁正常组织中的表达差异。结果显示,NAF1, PRIM2, TIMELESS在癌组织中表达上调,而CPNE8, HLA-A等基因表达下调。一个有趣的发现是,虽然遗传数据强烈支持GRHPR对CRC风险的保护作用,但其mRNA表达量在TCGA的肿瘤与正常组织间并无显著差异。进一步分析发现,GRHPR的表达与肿瘤纯度呈正相关。这表明GRHPR的保护作用可能主要发生在肿瘤发生早期或风险形成阶段,而在已形成的肿瘤中,其表达变化可能被肿瘤微环境复杂性所掩盖。
The relationship between gene expression levels and survival rates in COAD patients(基因表达水平与COAD患者生存率的关系)
最后,通过生存分析评估了关键基因的临床预后价值。结果发现,遗传预测的基因效应与临床结局高度一致:高表达NAF1的CRC患者具有更好的总生存期(OS)和无复发生存期(RFS);而高表达ZNF365则预示着更差的RFS。这提示NAF1和ZNF365不仅是CRC的风险基因,也是潜在的预后生物标志物。
归纳与讨论
本研究通过创新的多组学孟德尔随机化分析,首次系统性地提供了遗传证据,表明特定昼夜节律相关基因与结直肠癌(CRC)风险存在潜在的因果关系。研究最核心的发现是确立了GRHPR(乙醛酸/羟基丙酮酸还原酶)基因作为关键的CRC风险降低因子。该基因在DNA甲基化、基因表达和蛋白质水平上均显示出与CRC风险的显著负相关,并得到共定位分析的有力支持。研究者推测,GRHPR可能通过调节细胞代谢(如乙醛酸、羟基丙酮酸代谢)、维持氧化还原稳态以及潜在地与昼夜节律网络相互作用,在CRC发生早期起到保护作用。尽管在已建立的TCGA肿瘤中其表达无显著差异,但这恰恰提示了其作用可能主要体现在疾病起始的风险调控阶段。
此外,研究还揭示了NAF1和ZNF365作为“双重用途”生物标志物的巨大潜力:它们不仅从遗传角度分别与降低和升高CRC风险相关,其表达水平还能有效预测患者的生存结局(OS和RFS)。这种遗传预测风险与临床预后价值的高度一致性,极大地增强了这些发现作为新型生物标志物的可信度。
这项研究的意义重大。首先,它超越了既往观察性关联,利用遗传工具为“昼夜节律紊乱促癌”提供了机制性的因果解释。其次,它成功地将基础研究与临床转化连接起来:发现的基因(特别是GRHPR, NAF1, ZNF365)不仅深化了我们对CRC发病分子机制的理解,也为未来的精准医学实践提供了新靶点。例如,激活GRHPR通路可能成为一种新的预防或治疗策略,而NAF1和ZNF365则可用于患者的风险分层和预后评估。当然,研究也存在局限性,如数据主要源于欧洲人群,结论需在其他族群中验证,且需后续的功能实验来阐明确切的分子机制。总之,这项研究为理解昼夜节律与癌症的交互作用开辟了新视角,并为结直肠癌的早期预防、风险预测和靶向治疗带来了充满希望的新线索。