基于基因表达谱评估化学物质作为乳腺癌风险因素的新策略

《Scientific Reports》:Assessment of chemical risk factor for breast cancer based on gene expression profiles

【字体: 时间:2025年12月18日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对环境化学物在乳腺癌发生中的潜在作用尚不明确的问题,通过整合LINCS L1000体外毒理基因组学数据与TCGA-BRCA临床样本转录组数据,系统分析了161种可疑哺乳动物致癌物对MCF7细胞基因表达的影响。研究发现,多种化学物(如阿姆沙汀、氯氨布西)可显著扰动细胞周期、p53信号通路等乳腺癌相关通路,且其转录组特征与患者肿瘤组织高度相似(余弦相似度最高达0.369)。该研究为大规模筛查乳腺癌潜在化学风险因素提供了新的计算生物学方法,对癌症预防策略制定具有重要参考价值。

  
乳腺癌是全球女性中最常见的恶性肿瘤之一,每年新增病例超过230万,死亡病例数仅次于肺癌。尽管激素暴露与乳腺癌的关联已被证实,但环境中大量化学物质对乳腺发育和功能的干扰作用仍缺乏系统研究。尤其令人担忧的是,许多未被明确归类为致癌物的内分泌干扰化学物(EDCs),可能通过影响雌激素、孕激素信号通路或其他机制间接促进肿瘤发生。传统毒理学试验难以覆盖所有可疑化合物,亟需开发高效的计算方法识别潜在风险物质。
为此,巴黎西岱大学的Rayane Achebouche和Olivier Taboureau在《Scientific Reports》发表研究,通过整合多源转录组数据,构建了一种化学物乳腺癌风险评估新策略。研究人员首先从LINCS L1000数据库中提取了161种可疑哺乳动物致癌物(包括34种已知致癌物MC和127种可疑致癌物SMC)处理MCF7细胞后的基因表达谱,同时利用TCGA-BRCA项目的1092例乳腺癌组织样本和GTEx数据库的178例正常乳腺组织RNA测序数据,建立疾病特异性基因表达特征。通过过表征分析(ORA)、余弦相似度计算和加权基因共表达网络分析(WGCNA)等方法,系统比较了化学物扰动与临床样本的分子特征匹配度。
关键技术方法概述
研究主要基于三类数据:LINCS L1000平台的MCF7细胞化学扰动转录组数据(含978个标志基因和9196个推断基因)、TCGA-BRCA乳腺癌组织RNA测序数据(1092例)及GTEx正常乳腺组织数据(178例)。采用差异表达分析(DEG)筛选疾病相关基因,通过自定义基因评分公式(Gscore)量化化学物对通路的扰动强度,利用余弦相似度评估化学物与肿瘤转录组特征的匹配度,并结合WGCNA识别共表达模块。所有分析均针对24小时暴露实验,浓度范围限定为0.1-1.3 μM以优化信号噪声比。
结果分析
1. L1000分析:已知与可疑致癌物扰乱癌症相关通路
过表征分析显示,MC和SMC化合物均显著上调了乳腺癌相关通路,如“细胞周期”“p53信号通路”和“MAPK级联负调控”。
值得注意的是,SMC化合物还特异性扰动了内分泌相关通路(如“雌激素信号通路”“孕激素介导的卵母细胞成熟”),提示其可能通过干扰激素平衡参与致癌过程。
2. 转录组相似性揭示可疑致癌物的风险特征
通过余弦相似度比较MC与SMC化合物的转录组谱,发现部分SMC化合物(如奥硝唑、叔丁基氢醌)与已知致癌物(如多柔比星)的相似度高达0.843。
且某些化合物(如木犀草素)在低浓度(0.08 μM)时与致癌物相似度更高,表明其风险具有浓度依赖性。
3. TCGA-GTEx组织水平分析验证病理特征
UMAP降维分析证实,乳腺癌组织与正常乳腺组织转录组特征显著分离,但不同病理分期样本未形成独立集群,支持采用整体疾病特征进行对比。
差异表达基因富集分析显示,患者组织中上调通路与L1000数据高度重叠(如IL-17信号通路),而下调基因多涉及代谢通路(如糖酵解/糖异生),提示代谢重编程在乳腺癌中的关键作用。
4. 化学物诱导的转录组特征与患者样本匹配
对比L1000数据与TCGA-GTEx参考特征,13种MC化合物(如阿姆沙汀、氯氨布西)和48种SMC化合物(如柚皮素、艾司西酞普兰)的转录组谱与患者样本显著相似(|z-score|>2时相似度阈值0.178)。
其中,吡嗪酰胺在0.125 μM浓度下相似度最高(0.367)。值得注意的是,抗抑郁药艾司西酞普兰和氟伏沙明等SMC化合物均被识别为高风险物质,与流行病学研究中SSRIs(选择性5-羟色胺再摄取抑制剂)关联乳腺癌风险上升27%的报道一致。
5. WGCNA网络分析识别核心模块与枢纽基因
WGCNA将1092例患者基因分为13个共表达模块,其中绿-灰和紫-红模块富集了MC/SMC化合物共同扰动的基因(如MELK、E2F2、AURKA)。
这些基因多参与细胞增殖调控,且被西酞普兰、氟西汀等SMC化合物显著扰动,进一步支持其潜在致癌风险。
结论与讨论
本研究通过计算生物学方法构建了化学物乳腺癌风险评估新框架,证实部分未被明确归类为致癌物的SMC化合物(如内分泌干扰物、抗抑郁药)可诱导与临床乳腺癌样本高度相似的转录组特征。该方法突破了传统毒理学试验的局限性,为大规模筛查环境化学物风险提供了高效工具。然而,研究存在一定局限:MCF7细胞本身为乳腺癌细胞系,可能无法完全模拟健康组织的化学响应;LINCS数据中部分基因表达为推断结果;且未直接评估基因突变易感性的影响。未来需结合健康乳腺上皮细胞模型及遗传学数据进一步验证。总体而言,该研究为乳腺癌的化学预防和环境风险监管提供了重要科学依据。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号