《Hormones & Cancer》:Integrating multi-omics data and machine learning to identify endocrine disrupting chemicals targeting key ccRCC-related genes
编辑推荐:
本研究针对肾透明细胞癌(ccRCC)中环境暴露与遗传互作机制不明的难题,通过整合多组学数据与101种机器学习算法,构建了EDC相关预后模型(EPS),发现Diethylnitrosamine等8种内分泌干扰物通过调控BIRC5、CCND1等5个关键基因,经JAK-STAT/MAPK通路促进肿瘤干细胞特性及免疫微环境重塑。该研究为环境驱动型肿瘤的干预策略提供了单细胞水平的理论依据。
随着工业化进程加速,内分泌干扰化学物(EDCs)已通过工业副产品、化妆品、纺织品等途径广泛存在于环境中。这类外源性物质通过模拟或干扰内分泌系统功能,对发育、生殖、免疫等多系统产生不良影响。肾脏作为代谢和解毒的重要器官,尤其易受EDCs的毒性侵害。肾透明细胞癌(ccRCC)作为最常见的肾脏恶性肿瘤类型,约占肾癌病例的75%,其发生发展受到遗传易感性和环境暴露的双重影响。尽管早期ccRCC可通过手术切除获得较好预后,但约三分之一患者会出现转移。目前,关于EDCs如何与遗传因素相互作用调控ccRCC进展的分子机制尚不明确,这限制了针对环境驱动型肿瘤的有效预防和治疗策略的开发。
为破解这一难题,郑梦卓团队在《Discover Oncology》上发表了创新性研究,通过整合多组学数据和机器学习技术,系统揭示了EDCs通过调控关键基因影响ccRCC进展的新机制。研究人员首先收集了GSE15641、GSE16449和TCGA-KIRC三个队列的批量RNA测序数据,并利用单细胞RNA测序(scRNA-seq)数据从细胞分辨率层面解析肿瘤异质性。通过差异表达分析筛选出1748个ccRCC相关差异表达基因(DEGs),结合比较毒理学数据库(CTD)中与环境化学品相互作用基因,最终鉴定出12个与预后显著相关的EDC作用基因。
在研究技术方法上,作者主要运用了多组学数据整合分析、机器学习算法优化、单细胞转录组解析和体外实验验证四大关键技术。具体包括:从公共数据库获取批量与单细胞转录组数据并进行批次校正;采用101种机器学习算法组合(包括随机生存森林(RSF)、CoxBoost等)构建预后模型;利用Scissor算法识别表型相关细胞亚群;通过CellChat分析细胞间通讯网络;并采集临床样本进行qRT-PCR验证关键基因表达。
研究结果显示,通过机器学习算法优化,RSF结合CoxBoost的方法表现出最佳预测性能(平均C-index=0.684),并基于此建立了EDC相关预后评分(EPS)。该模型在独立验证集E-MTAB-1980中表现出良好的泛化能力,5年生存预测AUC达0.71。EPS将患者分为高风险和低风险两组,高风险患者预后显著较差。功能富集分析表明,两组差异基因主要富集在细胞分裂、核染色体分离等生物学过程,KEGG通路分析显示细胞周期、DNA复制等通路显著激活。
研究人员进一步构建了EDC-基因-ccRCC相互作用网络,发现8种EDCs(包括Diethylnitrosamine、Diethylstilbestrol、Arsenic等)通过调控5个核心基因(BIRC5、CCND1、RRM2、CDH1、TRIB3)影响疾病进程。其中CCND1(细胞周期蛋白D1)受最多EDCs调控,提示其在环境致癌中的枢纽作用。机制上,EDC相关基因与JAK-STAT、MAPK信号通路活性呈正相关,与肿瘤干细胞指数(mRNAsi)升高密切相关。免疫浸润分析显示高风险组调节性T细胞(Tregs)和M0型巨噬细胞显著增加,提示免疫抑制微环境特征。
在单细胞层面,研究团队通过Scissor算法识别出3776个与EPS正相关的细胞,这些细胞主要分布于上皮细胞、T细胞和内皮细胞亚群。代谢分析显示上皮细胞中EDC敏感细胞富集于细胞色素P450介导的外源物代谢、类固醇激素合成等通路,而巨噬细胞中则主要表现为戊糖磷酸途径和糖鞘脂代谢异常。细胞通讯分析揭示EDC阳性细胞主要通过直接接触和分泌信号两种模式进行交流,其中上皮细胞与内皮细胞、树突状细胞间的信号传递尤为活跃。
讨论部分指出,本研究首次在单细胞分辨率层面揭示了EDCs通过调控细胞周期相关基因(如CCND1、BIRC5)促进ccRCC进展的新机制。CCND1作为G1/S期转换的关键调控因子,其异常表达可导致RB蛋白磷酸化和E2F1转录激活,驱动肿瘤增殖。BIRC5(存活素)通过调控染色体乘客复合物(CPC)影响有丝分裂过程。特别值得注意的是,重金属类EDCs如砷和铅可通过诱导表观遗传修饰改变(如DNMT3A/3B过表达)和DNA甲基化异常,这为环境污染物致癌提供了表观遗传学解释。
该研究的创新性在于将批量转录组与单细胞测序相结合,突破了传统研究仅依赖批量数据的局限,首次从细胞异质性角度阐释了EDCs对肿瘤微环境的重塑作用。发现的EDC-基因互作网络为环境相关肿瘤的生物标志物开发提供了新靶点,同时为制定针对性的环境污染物防控策略提供了科学依据。未来研究可通过前瞻性队列设计结合生物监测数据,进一步验证特定EDCs暴露水平与ccRCC进展的因果关系,为环境健康政策的制定提供更充分的证据支持。