邻苯二甲酸二乙酯(DEP)诱导骨肉瘤新机制:多组学整合揭示P4HA2/COL18A1介导的细胞外基质重塑

《Journal of Enzyme Inhibition and Medicinal Chemistry》:Diethyl Phthalate (DEP) as a potential osteosarcoma risk factor: a multi-omics study integrating network Toxicology, single-cell RNA sequencing, and molecular docking

【字体: 时间:2026年02月17日 来源:Journal of Enzyme Inhibition and Medicinal Chemistry 5.4

编辑推荐:

  本文综述了环境内分泌干扰物邻苯二甲酸二乙酯(DEP)在骨肉瘤(OS)中的潜在致癌机制。作者运用网络毒理学、单细胞RNA测序(scRNA-seq)及分子对接等前沿技术,揭示了DEP通过靶向P4HA2与COL18A1蛋白,扰乱细胞外基质(ECM)稳态,从而可能促进OS进展的新通路,为环境致癌物的风险评估及OS新型诊断标志物开发提供了重要理论依据。

  

引言

近年来,塑料增塑剂等化学材料的广泛应用引发了对人类健康的潜在威胁的广泛关注。其中,邻苯二甲酸二乙酯(Diethyl Phthalate, DEP)作为一种常用增塑剂和内分泌干扰物,广泛存在于玩具、牙刷、食品包装、化妆品及医疗设备等日常用品中,导致人群普遍暴露。DEP因其亲脂性和环境持久性,易于在生物体内蓄积,其潜在的生殖毒性和致癌风险,尤其是在儿童发育关键窗口期的长期暴露影响,日益受到科学界重视。尽管有研究已将DEP与多种癌症联系起来,但其在骨肉瘤(Osteosarcoma, OS)发生发展中的具体作用机制尚不明确。
骨肉瘤是一种起源于间充质干细胞的高度恶性骨肿瘤,好发于儿童和青少年,是儿童最常见的原发性恶性骨肿瘤。由于起病隐匿,OS常在出现局部广泛侵袭或远处(尤其是肺部)转移时才被诊断,严重影响了患者预后。尽管手术联合化疗的多模式治疗在一定程度上改善了患者的生存率,但过去几十年来OS患者的5年总生存率仍停滞不前。OS的发生发展涉及遗传易感性、放疗以及环境因素的复杂相互作用。越来越多的证据表明,双酚A(BPA)等环境内分泌干扰物可通过调控特定信号通路促进OS细胞的增殖与侵袭。作为一种结构相似的增塑剂,DEP在儿童期的暴露与19岁前骨肉瘤和淋巴瘤发病率增加可能存在关联,但其分子机制仍有待阐明。

方法与材料

为填补这一知识空白,本研究采用了一项综合性的多组学研究策略,整合了网络毒理学、转录组学、机器学习、分子对接、分子动力学(MD)模拟以及单细胞RNA测序(scRNA-seq)等多种技术手段,旨在系统探究DEP在OS中的潜在致癌机制。
DEP相关靶点的识别与收集:研究人员首先从PubChem数据库获取了DEP的规范结构、分子式和SMILES编码。随后,从多个公开毒理基因组学数据库,包括比较毒理基因组学数据库(Comparative Toxicogenomics Database, CTD)、ChEMBL、TargetNet和SwissTargetPrediction,检索并整合了与DEP相关的人类基因靶点,构建了一个全面的DEP相关基因集。
数据获取与处理:研究从基因表达综合(Gene Expression Omnibus, GEO)数据库获取了三个独立的OS基因表达数据集(GSE99671、GSE39058和GSE19276)用于分析。GSE99671和GSE39058经过预处理和批次效应校正后合并为训练队列,而GSE19276作为独立验证集。此外,包含六个OS样本的scRNA-seq数据集(GSE162454)被用于单细胞水平的分析。
OS差异表达基因(DEGs)的识别与功能富集分析:通过对训练队列数据进行差异表达分析,共识别出713个DEGs,包括371个上调基因和342个下调基因。对DEGs进行基因本体(Gene Ontology, GO)和京都基因与基因组百科全书(KEGG)通路富集分析,发现这些基因在细胞外基质(ECM)结构成分、胶原蛋白包含的ECM、ECM组织等生物学过程和通路上显著富集。
蛋白质-蛋白质相互作用(PPI)网络构建与枢纽基因识别:将713个DEGs与932个DEP相关基因取交集,获得了45个重叠基因,被认为是DEP响应且与OS相关的候选基因。对这45个基因进行PPI网络构建,并利用Cytoscape软件及cytoHubba插件中的六种拓扑算法(如MCC、MNC、Degree等)进行分析,筛选出11个枢纽基因。
机器学习算法进行特征基因选择:为进一步精炼枢纽基因,研究采用了三种机器学习算法——最小绝对收缩与选择算子(LASSO)回归、支持向量机-递归特征消除(SVM-RFE)和Boruta算法,对11个枢纽基因进行特征选择。最终,COL18A1、P4HA2和COL10A1三个基因被三种算法一致筛选为核心特征基因。
OS样本中核心基因的单细胞转录组分析:对GSE162454单细胞数据集的分析揭示了三个枢纽基因在肿瘤微环境中的空间表达模式。经过严格的质量控制和批次校正,共保留29,009个高质量细胞。细胞被注释为巨噬细胞、CD8+T细胞、成纤维细胞、内皮细胞、B细胞、单核细胞、星形胶质细胞和造血干细胞等八种主要类型。分析显示,COL18A1主要在内皮细胞和成纤维细胞中富集,P4HA2在成纤维细胞和星形胶质细胞中高表达,而COL10A1在所有细胞类型中表达均很低或可忽略不计。
DEP与核心靶点的分子对接与分子动力学模拟分析:为评估DEP与候选枢纽蛋白的结合亲和力及相互作用模式,研究进行了分子对接和100纳秒的分子动力学模拟。从RCSB蛋白质数据库获取了COL18A1、P4HA2和COL10A1的蛋白质晶体结构。DEP与P4HA2的结合主要通过氢键(与ARG380)和疏水相互作用(涉及GLN417、THR467、VAL513、ASN515、TYR517等残基)稳定,计算得到的结合自由能为-24.58 ± 2.65 kcal/mol。DEP与COL18A1的结合则涉及与TYR1476和LYS1485形成的氢键,以及PHE1483的π-π堆积作用,结合自由能为-23.57 ± 3.19 kcal/mol。相比之下,DEP与COL10A1的结合非常弱且不稳定(结合自由能为-7.09 ± 2.47 kcal/mol),这与scRNA-seq中其低表达的结果一致。
利用独立数据集验证枢纽基因表达:最后,研究利用独立验证数据集GSE19276评估了枢纽基因的诊断潜力。结果显示,COL18A1和P4HA2在OS组织中显著上调,并在区分OS组织与正常骨组织方面表现出优异的诊断性能,其中P4HA2的曲线下面积(AUC)高达0.957。

结果

OS中DEGs的识别与可视化:整合并校正两个GEO数据集(GSE99671和GSE39058)的批次效应后,主成分分析(PCA)显示批次偏差被有效移除。差异表达分析共鉴定出713个DEGs。热图可视化显示OS与正常组织样本之间存在明显的转录差异。
DEGs的功能富集分析:GO分析显示,DEGs在分子功能(MF)上富集于ECM结构成分、有机酸结合等;在细胞组分(CC)上富集于胶原蛋白包含的ECM、内质网腔等;在生物过程(BP)上富集于ECM组织、骨形态发生等。基因集富集分析(GSEA)进一步揭示,下调通路与免疫和代谢活性抑制相关,而上调基因则与蛋白质合成和代谢适应增强有关。
DEGs与DEP相关靶点的整合及功能富集分析:45个重叠基因的KEGG富集分析表明,它们最显著富集于ECM-受体相互作用通路,此外还涉及蛋白质消化与吸收、脂质与动脉粥样硬化、PPAR信号通路等。GO分析进一步确认了这些基因在ECM重塑、脂质调节和骨形态发生中的潜在作用。
PPI网络构建与枢纽节点识别:基于45个重叠基因构建的PPI网络显示出显著的生物学连通性。利用多种拓扑算法分析后,确定了11个一致的枢纽蛋白。进一步通过三种机器学习算法筛选,最终锁定COL18A1、P4HA2和COL10A1为核心候选基因。
单细胞转录组分析揭示DEP相关枢纽基因的细胞类型特异性表达:单细胞分析明确展示了COL18A1和P4HA2在肿瘤微环境中特定细胞群(内皮细胞、成纤维细胞、星形胶质细胞)中的高表达,而COL10A1表达极低,突出了前两者在肿瘤基质重塑中的潜在细胞类型特异性作用。
分子对接与动力学模拟揭示DEP与关键蛋白靶点的特异性结合:分子对接和动力学模拟为DEP与P4HA2、COL18A1的稳定结合提供了结构证据。DEP与这两个蛋白均能形成稳定的复合物,结合自由能有利,且分子动力学模拟期间的均方根偏差(RMSD)曲线稳定,而DEP与COL10A1的结合则较弱且不稳定。
枢纽基因表达与诊断准确性的验证:在独立验证队列中,COL18A1和P4HA2均表现出显著的上调,并具有很高的诊断区分能力,AUC值分别达到0.809和0.957,证实了其作为OS诊断生物标志物的潜力。

讨论

本研究通过整合多组学数据,首次系统揭示了DEP在OS中的潜在致癌机制,并确定了P4HA2和COL18A1为关键DEP响应基因。DEP作为一种普遍存在的环境污染物,其与肿瘤发生的关系,特别是在OS中的机制,此前研究甚少。本研究发现,DEP相关基因显著富集于ECM-受体相互作用等与肿瘤侵袭和转移密切相关的通路,提示DEP可能通过重塑肿瘤微环境中的ECM来促进OS进展。
P4HA2是脯氨酰4-羟化酶的一个亚型,负责胶原蛋白中脯氨酸残基的羟基化,对稳定胶原三螺旋结构至关重要。其过表达可促进ECM沉积,增强肿瘤侵袭性。COL18A1编码胶原XVIII的α链,是血管基底膜的主要成分,其C端片段内皮抑素具有调节血管生成的活性。我们的单细胞分析显示,P4HA2主要在成纤维细胞和星形胶质细胞中表达,而COL18A1主要在内皮细胞和成纤维细胞中富集,这与它们在ECM和血管基质调控中的作用相符。
分子对接和动力学模拟结果表明,DEP能够以较高的亲和力与P4HA2和COL18A1蛋白稳定结合,其结合自由能甚至优于某些已知抑制剂。这为DEP可能通过直接干扰这些ECM修饰酶的活性来影响肿瘤微环境提供了结构生物学层面的支持。同时,COL10A1由于结合弱且在单细胞水平表达量低,被排除出核心机制。
临床验证进一步强化了这些发现的潜在转化价值。COL18A1和P4HA2在独立OS队列中不仅表达上调,而且展现出优异的诊断性能,提示它们可能作为OS,特别是与DEP暴露相关的OS的新型生物标志物。

结论

本研究首次通过整合网络毒理学、转录组学、机器学习、分子模拟及单细胞测序等多维度技术,深入探讨了DEP在骨肉瘤中的潜在作用机制。研究结果确定P4HA2和COL18A1为DEP关联的关键调控因子,它们与DEP具有强结合亲和力,在OS中表达上调,并展现出强大的诊断潜力。这些发现深化了我们对环境污染物DEP致癌机制的理解,为未来开发针对DEP相关通路的OS诊断和 therapeutic targeting 策略奠定了坚实的分子基础。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号