基于毒理基因组学数据的化学物质累积评估组构建:从CGPD四联体到新型分组框架

【字体: 时间:2025年10月10日 来源:Archives of Toxicology 6.9

编辑推荐:

  本研究针对化学混合物累积风险评估中数据匮乏的挑战,开发了一种基于毒理基因组数据库(CTD)的化学-基因-表型-疾病(CGPD)四联体分析框架。研究人员通过整合多维度组学数据,成功实现了对农药、药物及工业化学品的机制化分组,不仅验证了EFSA已建立的累积评估组(CAGs),还发现了与内分泌干扰和代谢紊乱相关的新化学簇。该研究为推进下一代证据导向的化学风险评估提供了重要方法论支持。

  
随着全球市场上化学物质数量超过35万种,人类通过环境和食品同时暴露于数百种化学物质的混合物已成为常态。这些化学物质在生物体内可能产生叠加效应,对健康构成潜在威胁。然而,传统的化学风险评估主要依赖动物实验和有限的毒理学数据,难以应对如此庞大数量的化学物质及其组合效应。欧洲食品安全局(EFSA)虽已建立累积评估组(CAGs)框架,将具有相同作用机制或靶器官毒性的农药进行分组评估,但其分组方法仍主要基于传统毒理学数据,存在数据更新滞后、机制证据不足等局限性。
在这项发表于《Archives of Toxicology》的研究中,由Sebastian Canzler和J?rg Hackermüller领衔的研究团队开发了一种创新的数据驱动框架,利用公开的毒理基因组学数据实现化学物质的机制化分组。研究人员从比较毒理基因组学数据库(CTD)中提取化学-基因-表型-疾病(CGPD)四联体,通过计算生物学方法识别具有相似分子机制和表型效应的化学物质,为化学混合物的累积风险评估提供了新的解决方案。
研究团队采用多维度数据整合策略,主要关键技术方法包括:从CTD和PubChem数据库构建标准化化学-基因-表型关联数据库;建立物种和组织特异性数据过滤流程;开发CGPD四联体计算算法;实施基于表型语义相似性和化学清单相似性的双重聚类策略;使用EFSA农药清单和DrugBank药物数据进行方法验证。所有分析均通过自主开发的MoReCluster工具实现,确保了研究结果的可重复性。

数据覆盖度分析揭示CTD数据库特征

研究人员首先对CTD数据库进行了全面评估,发现人类、小鼠和大鼠占据了化学-基因互作数据的85%以上,其中人类数据最多(693,470条互作)。组织分布分析显示,肝脏、神经系统和生殖系统是研究最充分的靶器官。在化学类别覆盖度方面,药物类化合物在数据库中占比最高(73%),而农药仅占7%,反映了数据收集的历史偏向性。

分组与聚类策略优化

研究团队比较了两种分组策略:基于基因-表型-疾病(GPD)的精确分组和基于表型-疾病(PD)的宽松分组。结果显示,PD分组产生的化学组数量更少但组内化学物质更多,而GPD分组则产生更多特异性强的分组。表型语义相似性聚类相比化学清单相似性聚类对结果影响更大,通过调整相似度阈值(0.5-0.9)可有效控制组内表型多样性。

EFSA CAG农药的组织特异性比较

与EFSA已建立的累积评估组比较显示,CGPD方法成功复现了63种农药中的三分之二的已知组织关联,特别是在神经系统毒性方面高度一致。同时,该方法还发现了EFSA报告中未包含的化学-组织关联,如肝脏(15种新关联农药)、血液系统(22种新关联)和生殖系统(8种新关联),为CAG的扩展提供了候选物质。

少精子症相关化学簇特征

研究人员发现了一个与少精子症(Oligospermia)密切相关的化学簇,包含37种化学物质,其中12种为农药。该化学簇涉及7个关键基因(Fshb、Esr1、Nr0b1等)和19个表型术语,主要影响类固醇合成过程和雄性生殖发育。值得注意的是,除已知的抗雄激素农药外,该簇还包含了双酚A、B、S等塑料添加剂,以及邻苯二甲酸酯类增塑剂,展示了跨类别化学物质的共同作用机制。

高血糖症相关化学簇机制

另一个典型案例是高血糖症相关化学簇,包含31种化学物质,涉及8个葡萄糖代谢关键基因(Gck、Il6、Ins1、Ins2等)。该簇既包含有机磷农药(毒死蜱、二嗪农)和新烟碱类农药(吡虫啉),也包含重金属(铅、砷)和药物(链脲佐菌素、地塞米松),甚至包含本应降糖的药物(二甲双胍、格列本脲)。这种看似矛盾的结果反映了CTD数据库中同时包含"标志/机制"和"治疗"两种关联类型,需要通过过滤策略进行区分。
研究结论表明,基于CGPD四联体的化学分组方法能够有效识别具有共同分子机制和表型效应的化学物质,不仅验证了现有监管分组,还提出了扩展方案。该方法的核心优势在于:利用持续更新的科学证据;提供机制见解支持更高严格级别的分组;实现跨监管类别化学物质的统一评估;减少对动物试验的依赖。
讨论部分指出,CTD数据库的局限性(如 curation滞后性、性别信息缺失、效应方向不明确)可能影响分组的准确性。未来工作需要整合更多数据源,建立标准化分析流程,并通过实验验证预测的关联。总体而言,这项研究为证据导向的化学安全评估提供了有价值的新工具,支持混合物风险评估框架向机制 informed 的方向发展,最终促进化学监管向下一代评估方法的转型。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号