基于多组分相似性分析的潜在高关注物质(SVHC)智能识别新策略

【字体: 时间:2025年05月07日 来源:Computational Toxicology 3.1

编辑推荐:

  本研究针对化学品市场快速增长带来的监管挑战,开发了整合结构警报(Structural Alerts)、生物活性(Biological)和理化性质(PhysChem)相似性模块的计算模型,通过扩展Wassenaar等人开发的全局相似性(Global Similarity)方法,构建了可解释性更强的SVHC识别体系。研究证实多模块联合分析能提升预测稳定性,为CM/R/PBT-vPvB/ED类高关注物质的筛查提供新工具,推动计算毒理学在REACH法规中的应用。

  

随着全球化学品数量呈指数级增长,传统动物实验在效率和经济性上的局限性日益凸显。欧盟REACH法规将具有致癌、致突变、生殖毒性(CMR),或具有持久性、生物累积性和毒性(PBT/vPvB),以及内分泌干扰(ED)等特性的物质列为高关注物质(SVHC),但仅约5%上市化学品完成全面风险评估。这催生了计算毒理学的发展,其中基于结构相似性的"读取跨越"(Read-Across)技术成为重要替代方案,但现有模型存在解释性不足、适用范围有限等瓶颈。

为解决这些问题,研究人员在前期开发的ZZS全局相似性工具基础上,创新性地整合了三大新型相似性模块:1)结构警报相似性模块,通过ToxAlerts数据库和DART规则识别CM/R等终点的关键毒性基团;2)生物相似性模块,利用PubChem中13万+生物测定数据构建活性加权评分系统;3)理化相似性模块,采用OPERA软件预测9种性质并通过PCA降维分析。研究团队采用包含621种SVHC和406种非SVHC的数据集,通过平衡精度(bACC)优化各模块权重,最终建立多维度综合评价体系。

关键技术方法包括:1)基于Jaccard-Tanimoto系数的结构相似性算法;2)PubChem生物活性数据的层级加权处理(Active>Inactive>Inconclusive);3)OPERA预测的9种理化性质PCA降维;4)通过sigmoid函数实现相似性评分标准化;5)采用F1-score和bACC进行多模块权重优化。

结构警报相似性模块
分析显示CM和ED类SVHC的平均警报数显著高于非SVHC(CM:4.3 vs 1.2;ED:0.6 vs 0.04)。该模块对PBT/vPvB的识别表现最佳(bACC=0.949),因持久性相关的78种Lombardo警报与生物累积性18种Gobas警报具有高度特异性。

生物相似性模块
尽管41.7%的SVHC缺乏生物测定数据,但CM类物质仍展现出0.68的bACC。研究发现活性-活性组合权重设为1时,能有效捕捉如苯并[a]芘等典型CM物质的特征响应模式。

理化相似性模块
PBT/vPvB物质的欧氏距离分析显示最强关联性(bACC=0.71),印证了logP等性质对生物累积潜力的指示作用。ED物质因化学多样性低,其性质相似性阈值最严格(0.218)。

多模块整合
加权分析揭示不同终点的最优组合策略:CM模型侧重生物相似性(权重0.28),而PBT/vPvB模型依赖结构警报(权重0.28)。典型案例显示,氯苯(CAS 108-90-7)因缺少关键PBT结构片段,综合评分从0.57降至0.38,纠正了单一结构相似性的误判。

该研究开创性地构建了可解释的SVHC多维度识别框架,其核心价值在于:1)突破单一结构相似性局限,通过CM/R/PBT-vPvB/ED特异性模块提升靶向性;2)首创生物活性数据层级加权算法,解决稀疏数据利用难题;3)开发标准化评分系统,实现跨模块结果可比性。尽管生物相似性模块受数据完备性限制,但该体系已成功应用于荷兰SVHC清单的优先级排序,为欧盟化学品"分类-标签-限制"监管链条提供了智能决策工具。未来通过整合代谢组学数据和扩展ED结构警报库,有望进一步强化模型在复杂化学品风险评估中的适用性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号