
-
生物通官微
陪你抓住生命科技
跳动的脉搏
行为共病塑造结肠癌体细胞突变谱:烟草依赖的独特基因印记与肥胖糖尿病的代谢特征
【字体: 大 中 小 】 时间:2025年09月19日 来源:Future Science OA 2.1
编辑推荐:
本研究发现烟草依赖、肥胖和2型糖尿病(T2D)在结肠癌中呈现差异化的体细胞突变模式。烟草依赖展现出最强的诱变特征(如KEAP1、CDKN2A突变),肥胖关联基因集中于代谢/内分泌通路(如ASPSCR1、PGR),而糖尿病信号较弱(如MAF)。该研究为行为相关致癌机制的分子分型提供了关键证据。
烟草使用、肥胖和2型糖尿病是结直肠癌的明确风险因素,但其是否导致不同的肿瘤突变模式尚不清晰。烟草是已知诱变剂,而肥胖和糖尿病可能通过代谢和炎症途径发挥作用。
结直肠癌是全球癌症相关发病和死亡的主要原因,其发病机制涉及遗传和环境因素的双重作用。尽管遗传性胚系突变仅占少数病例,大多数结直肠癌是通过体细胞突变累积形成的,且受到可改变暴露因素的影响。在行为因素中,烟草使用、肥胖和2型糖尿病在流行病学研究中被一致认为是显著的风险因素。然而,尽管流行病学关联已很明确,但这些行为是否差异性地塑造结直肠肿瘤的体细胞遗传景观仍知之甚少。
烟草烟雾是DNA损伤剂的强效来源,先前在肺、头颈和膀胱癌中的研究表明,烟草暴露诱导特征性突变签名,包括碱基替换率和特定核苷酸转换的增加。相比之下,肥胖和2型糖尿病促成癌症风险的机制被认为主要是代谢性和炎症性的,涉及系统性改变,如胰岛素抵抗、慢性炎症和氧化应激。这些机制可能通过促进克隆扩张和肿瘤进展间接促进致癌作用,而非直接诱导DNA突变。这些不同的生物学通路是否在结直肠癌中体现为不同的体细胞突变谱尚未得到系统检验。
理解烟草依赖、肥胖和2型糖尿病等行为是否在肿瘤基因组上留下可识别印记至关重要。更清晰的行为特异性突变模式描述可为致癌机制提供见解,揭示预防或治疗的新分子靶点,并通过区分直接促进诱变的暴露与通过非遗传途径发挥致癌作用的暴露,为公共卫生策略提供信息。
患者数据来自加州大学健康数据仓库(UCHDW),这是一个去标识化的临床数据存储库,包含来自多个加州大学医疗中心的电子健康记录信息。通过SQL查询识别结肠癌患者,并将其与捕获临床基因测序结果的表格链接,突变在基因水平进行映射。测序源包括常规护理中使用的临床靶向panel;变异结果在分析中聚合到基因水平。
共病信息通过查询与烟草依赖、肥胖和2型糖尿病对应的诊断代码提取。由于这些条件的强烈行为基础,我们将其称为行为,同时认识到非行为病因因素的潜在影响。对于每位患者,这些行为的存在被确定为二元指标,如果记录有任何符合条件的诊断代码则分配1,否则为0。样本量低于十的基因-行为对被排除在进一步分析之外。最终的分析数据集包括每位患者的基因水平突变谱以及烟草依赖、肥胖和2型糖尿病的指标。
数据处理和统计分析在R(版本4.3.1)中进行。最初,清理基因名称以排除缺失或空条目。遗传突变数据随后被转换为独热编码矩阵,其中每列代表每个个体在特定基因中存在(1)或不存在(0)突变。该基因突变矩阵与共病状态使用患者标识符合并,以创建适合建模的整合数据集。
对于每个感兴趣的行为相关共病(烟草依赖、肥胖和2型糖尿病),进行了反向逻辑回归模型。具体来说,为每个基因拟合了单独的逻辑回归模型,使用突变存在(二元结果)作为因变量,共病状态(二元预测变量)作为自变量。为解决混淆,所有模型调整了诊断年龄(连续)、性别、种族/民族指标和AJCC分期(从TNM解析和插值衍生),并相互调整了其他两种行为。回归模型使用glm函数和二项族构建,结果被总结以提取每个模型中行为项的估计系数、标准误、检验统计量和p值。在每个行为内,p值使用Benjamini–Hochberg错误发现率(FDR)进行校正。为了报告和排名,我们施加了预先指定的资格标准,要求行为-突变2×2列联表的所有四个单元格至少为10,且双侧p<0.001。
这些回归的关键输出(优势比,来自模型系数的指数化)和相关统计量被编译用于进一步分析。为确保可解释性并促进跨行为比较,优势比进行了对数转换。
随后的分析侧重于确定哪些基因与每种行为最强烈且独特地相关。对于每个基因-行为对,计算了两个量:关联强度,定义为对数优势比的绝对值;以及关联独特性,定义为该基因对目标行为与对其他两种行为的平均对数优势比的绝对差。通过求和这两个量计算综合得分,强调遗传关联的幅度和行为特异性。
然后基于综合得分对基因-行为对进行排名,特别关注综合得分超过0.5的基因-行为对。执行了多维缩放和基于行为间跨基因突变谱的欧几里得距离的层次聚类,以可视化根据其相关遗传架构的行为分离。
我们识别了22,459名具有链接测序结果和行为编码的成年结肠癌患者。诊断中位年龄为61岁(四分位距,54–72;均值61.8),约55%为女性,45%为男性;约1.3%的患者性别缺失。种族和民族主要为白人(~84%),较小比例编码为黑人(~2.8%)、亚裔(~1.6%)、夏威夷原住民/太平洋岛民(~0.2%)、美洲原住民(~0.1%)和多种族(~0.9%);12%记录为西班牙裔/拉丁裔,84%为非西班牙裔/拉丁裔,缺失水平与性别相似。患者水平的行为流行率为烟草依赖4.37%(n=982)、肥胖12.34%(n=2,772)和2型糖尿病18.50%(n=4,156)。大多数患者没有三种行为中的任何一种(n=15,958;71.1%);单行为组数量为仅烟草2,944(13.1%)、仅肥胖616(2.7%)和仅糖尿病1,619(7.2%)。双行为重叠为烟草+糖尿病616(2.7%)、烟草+肥胖169(0.8%)和肥胖+糖尿病956(4.3%);87名患者(0.4%)具有所有三种。TNM解析和插值后,总体分期分布为I期557(2.5%)、II期7,803(34.7%)、III期4,903(21.8%)和IV期9,989(44.5%)。下文报告的所有关联估计均调整了年龄、性别、种族/民族、AJCC分期和其他两种行为。
跨基因panel,每种行为拟合了876个反向逻辑模型。Benjamini–Hochberg调整后,行为-基因关联q<0.10(q<0.05)的数量为烟草依赖119(95)、肥胖18(14)和2型糖尿病20(13)。应用研究的先验纳入标准以支持稳健解释(每个2×2列联单元格≥10且双侧p<0.001)产生了87个符合条件的基因-行为对。其中,60个烟草、12个肥胖和9个糖尿病对满足综合得分≥0.5,48个烟草、5个肥胖和3个糖尿病对超过1.0。符合条件对内的平均综合得分(SD;范围)为烟草依赖1.39(0.79;0.73–2.37)、肥胖1.24(0.88;0.37–3.07)和2型糖尿病0.74(0.39;0.22–1.57)。总体而言,烟草依赖显示出最多的高幅度、行为特异性关联和最广泛的综合得分分布,而糖尿病相关对较少且独特性较低。这些模式与烟草暴露相关的更诱变印记和肥胖与2型糖尿病的相对更微妙、代谢介导的特征一致。
检查单个基因时,几个基因因其强烈和特异性关联而值得注意。对于肥胖,ASPSCR1和PGR表现出最高的综合得分,反映了显著的关联强度和清晰的行为特异性。对于烟草依赖,KEAP1和CDKN2A作为具有最强和最独特关联的基因出现。
2型糖尿病的高得分基因相对稀缺,表明该行为组中的遗传突变模式在此队列中与烟草依赖或肥胖相比可能较不独特。这一观察可能反映了2型糖尿病的多因素病因,其中环境和代谢因素可能比通过可用测序数据可检测的单基因突变贡献更 substantially。
本研究调查了结肠癌患者的体细胞突变谱是否根据烟草依赖、肥胖或2型糖尿病的存在而不同。我们的结果表明,与烟草依赖相关的体细胞突变形成了与肥胖或2型糖尿病相关突变相比高度独特的模式。烟草依赖与更多基因突变相关,这些突变显示出强烈且行为特异性的关联,并且综合得分的分布表明与烟草依赖相关的遗传扰动更显著和异质。这些发现与烟草作为一种独特诱变暴露塑造致癌突变一致,而非仅仅代表几种可修改行为风险因素之一。
与调整后的结果一致,最高且最行为特异性的烟草关联映射到诱变、氧化应激环境下预期的通路:KEAP1的丢失或突变将激活NRF2驱动的抗氧化程序,使在烟草衍生的活性物种后存活成为可能;CDKN2A的中断废除p16/p14-ARF检查点并促进克隆扩张;STK11/LKB1整合能量应激与DNA损伤响应;SOX2支持损伤后可重新填充的干细胞样状态;PRKDC和TOP2A指示双链断裂修复和复制应激;EZH2和SF3B1涉及表观遗传重编程和异常剪接;LRP1B丢失是烟草暴露设置中复发的肿瘤抑制事件;受体/激酶信号(KDR、EPHA3、NTRK3、IL7R、BTK)突出了在烟草驱动进化过程中被共同选择的血管生成和免疫/导向程序。相比之下,领先的肥胖特异性信号(ASPSCR1和PGR,另有PCLO、NY-ESO-1和WNK1的额外支持)与内分泌-代谢和炎症重编程一致:ASPSCR1与转录和代谢重编程及血管生成程序相关,PGR反映可调节上皮增殖和炎症的类固醇激素信号,PCLO提示神经内分泌囊泡循环影响,NY-ESO-1指向免疫原性癌症-睾丸抗原生物学,WNK1将应激响应激酶活性与离子转运和胰岛素通路连接。糖尿病显示出相对较少的高特异性对,MAF作为顶部信号,与烟草相比,反映了更微妙、代谢介导的印记。 together这些基因水平模式与我们的更广泛结果在生物学上一致:烟草依赖表现出以氧化应激适应和检查点逃逸为特征的突变谱,而肥胖和糖尿病显示出与内分泌-代谢和炎症调节更一致而非直接遗传毒性的信号。
2型糖尿病观察到的相对弱且均匀的突变信号特别值得注意。尽管有强有力的流行病学证据将糖尿病与增加的癌症风险联系起来,但在体细胞突变分析的背景下,糖尿病患者中发生的癌症的遗传独特性似乎相对 modest。这一发现强化了以下理解:糖尿病的促肿瘤效应可能主要通过非诱变机制介导,如生长因子失调和免疫调节,而非通过产生独特的突变负担。
几个特定基因基于其高综合得分和行为特异性值得进一步研究。对于肥胖,ASPSCR1和PGR作为领先信号出现。ASPSCR1最著名的是ASPSCR1::TFE3融合的5′伙伴,该融合在癌症中重编程转录和血管生成程序,强调了其塑造肿瘤生物学的潜力。PGR编码孕酮受体;结直肠癌中的临床病理和实验工作表明孕酮信号可影响上皮增殖、炎症和预后。对于烟草依赖,KEAP1和CDKN2A显示出强烈、行为特异性的关联。KEAP1丢失激活NRF2依赖性氧化应激响应(可能由烟草衍生的活性物种 engaged),而CDKN2A的改变破坏细胞周期控制; together这些通路与诱变暴露谱一致。
这项研究的结果具有重要含义。从生物学角度来看,它们表明烟草暴露可能通过与其他行为风险因素 fundamentally 不同的体细胞遗传机制产生癌症,即使在相同器官系统内。临床上,这些结果提出了以下可能性:在烟草依赖背景下出现的肿瘤可能具有独特的脆弱性或治疗靶点,可为个性化治疗策略提供信息。公共卫生讯息也可能受益于强调烟草不仅仅是许多可修改风险之一,而是一种独特的诱变暴露,对肿瘤生物学具有深远且特定的后果。
几个局限性值得考虑。此分析仅限于临床测序 assay 中可检测的体细胞突变谱,并未考虑潜在的表观遗传改变、结构变异或非编码区突变。此外,尽管该研究使用了大型且多样化的临床数据库,但不能排除其他环境、人口统计或治疗因素的残留混淆。而且,行为分类依赖于诊断编码,可能 undercapture 行为严重程度或相对于癌症发病的时间。在独立队列中的外部验证和扩展到更广泛的基因组 assay 在当前批准和数据访问下不可行;我们将其确定为未来工作的优先事项。
在这项结肠癌患者的研究中,我们证明烟草依赖与肥胖或2型糖尿病相比,与独特且显著不同的体细胞突变谱相关。烟草相关肿瘤表现出更强且更行为特异性的遗传改变,与烟草暴露的独特诱变贡献一致。相比之下,肥胖和2型糖尿病与较弱且较不独特的突变模式相关,与它们作为癌症的代谢促进剂而非基因组损伤的直接诱导剂的作用一致。这些发现突出了烟草与其他可修改风险因素之间的关键生物学区别,并强调了将烟草使用视为在分子水平上癌症发展的独特且强效贡献者的重要性。
本研究根据加州大学健康系统IRB协议1604619-1豁免人体受试者保护。
RC单独贡献了此工作的以下方面:概念化、数据管理、形式分析、调查、方法论、项目管理、资源、软件、验证、写作—原稿和写作—审阅编辑。
支持本研究结果的数据来自加州大学健康数据仓库(UCHDW),该仓库由去标识化患者信息组成。由于临床数据的敏感性及其获取协议,数据无法公开可用。
生物通微信公众号
知名企业招聘