EcoDrug PLUS:面向药物靶标保守性分析与环境风险评估的先进数据库
《Nucleic Acids Research》:EcoDrug PLUS: an advanced database for drug target conservation analysis and environmental risk assessment
【字体:
大
中
小
】
时间:2025年11月23日
来源:Nucleic Acids Research 13.1
编辑推荐:
本刊编辑推荐:为解决药物及农用化学品对野生动物潜在环境风险问题,研究人员开发了EcoDrug+数据库,整合了约7200种药物、34000种农用化学品及61000种人类代谢物的基因组与化学信息,通过Ensembl orthology预测分析180种野生生物中人类药物靶标的保守性,提供化学结构搜索、靶点BLAST及作用机制查询功能,为环境风险前瞻性评估提供了关键工具。
随着医药、农业和工业化学品的广泛使用,其在环境中的残留对野生动物和人类健康构成了潜在威胁。从鱼类生殖发育异常到抗生素耐药性传播,从亚洲秃鹫因双氯芬酸中毒导致种群锐减,到海洋软体动物繁殖失败,这些案例凸显了化学物质环境影响的严重性。然而,传统回顾性评估难以应对低浓度长期暴露的挑战,亟需发展前瞻性预测工具。活性药物成分(API)在设计上能够以亚微摩尔浓度作用于特定蛋白靶点,而野生动物常携带与人类高度同源的靶点蛋白,这使得它们可能对药物及农用化学品产生敏感反应。研究表明,斑马鱼甚至与86%的人类药物靶点存在直系同源关系,且40%-60%的序列一致性就足以在体外实验中引发交叉反应。这一背景催生了对整合化学物质与生物靶点信息的开放平台的需求。
研究团队通过整合13个公共数据库资源,建立了基于PostgreSQL的对象关系型数据库EcoDrug+。关键技术方法包括:利用Ensembl(版本110-112)直系同源基因预测系统分析180个物种的靶点保守性;通过RDKit计算化学结构相似性并构建最大公共子结构(MCS)聚类;采用Apache Spark集群处理化学信息与生物活性数据;收集并地理编码266种化学物质的环境监测浓度数据。
数据库内容与架构
EcoDrug+包含111,816条记录,涵盖7,970种API(含盐型/游离型)、29,066种农用化学品及61,000种代谢物。靶点库收录828个人类药物靶点基因(对应127,219个直系同源蛋白),按ChEMBL六级分类系统组织,并标注1,092种作用机制(MoA)。数据库架构以“靶点”和“化合物”表为核心,通过九组数据表关联理化性质、代谢通路及环境监测数据。
靶点保守性分析
基于Ensembl多序列比对与系统发育树重建,EcoDrug+显著提升了直系同源注释准确性。结果显示,50%的人类药物靶点基因在秀丽隐杆线虫(Caenorhabditis elegans)和黑腹果蝇(Drosophila melanogaster)中保守。通过序列一致性分布直方图可直观比较不同物种(如小鼠、鸭、斑马鱼)与人类靶点的进化距离,为功能保守性推断提供依据。
化学聚类与知识图谱
通过无监督机器学习对4,086种药物进行MCS聚类,形成526个化学结构簇,并构建交互式知识图谱关联靶点、MoA与适应症。用户可通过“化学结构”菜单探索相似化合物群,实现基于结构的交叉注释预测。
数据检索与扩展功能
提供文本查询、化学结构绘制、靶点BLAST检索及多选MoA搜索四种交互方式。新增自定义BLAST功能支持用户序列在23个环境相关基因组中扫描相似序列,弥补了直系同源注释对旁系同源覆盖的不足。数据库还链接至25个外部资源(如US-EPA CompTox、Reactome),支持化合物与靶点的深度注释。
EcoDrug+通过融合化学信息学与基因组保守性分析,建立了机制导向的环境风险筛查平台。其结构化聚类与知识图谱支持基于化学相似性和靶点保守性的交叉推断,为药物、农用化学品及生物活性物质的生态毒理评价提供了新范式。未来可通过纳入低等植物基因组、扩展分子起始事件(MIE)与不良结局通路(AOPs)数据,进一步强化其在整合人类与环境健康评估中的枢纽作用。该研究发表于《Nucleic Acids Research》数据库专刊,体现了生物信息学工具在可持续化风险管理中的前沿应用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号