“混合指纹” 助力广义跨读预测:提升体内毒性评估精准度

【字体: 时间:2025年05月07日 来源:Computational Toxicology 3.1

编辑推荐:

  在危害评估中,跨读(Read - across)是填补数据空白的重要方法。广义跨读(GenRA)可实现客观、可重复的预测,但其中 “混合指纹” 功能未被系统评估。研究人员对比混合指纹与摩根指纹预测体内毒性效果,发现混合指纹能提升预测性能,为 GenRA 应用提供参考。

  在当今的环境健康和毒理学研究领域,危害评估是一项至关重要的工作。传统的实验方法往往需要耗费大量的时间、人力和物力来获取化学品的毒性数据,这对于数量庞大的化学物质而言,几乎是一项不可能完成的任务。于是,跨读(Read - across)技术应运而生,它作为一种数据填补的有效手段,能够利用已知化学物质的数据来预测未知化学物质的性质和毒性,从而大大提高危害评估的效率。
广义跨读(Generalized Read - across,GenRA)作为一种先进的算法方法,旨在实现客观且可重复的跨读预测,为毒理学研究提供了新的方向。GenRA 不仅有网页应用程序,其预测引擎还能以 Python 包(genra - py)的形式使用。然而,在 GenRA 的众多功能中,有一种 “混合指纹”(hybrid fingerprints)功能,虽然它允许基于多种相似性度量来识别源类似物,但一直以来都没有得到系统的评估。也就是说,对于特定的终点或化学物质,到底哪些指纹类型以及它们的百分比贡献是最优的,并没有明确的指导原则。这一现状严重限制了 GenRA 在实际应用中的准确性和有效性,为了解决这一问题,来自国外的研究人员开展了一项重要的研究。

研究人员以大鼠急性经口致死剂量(LD50)的大型数据集为基础,通过网格搜索(grid search)的方法,试图找到一种 “最优” 的混合指纹组合。在这个过程中,他们考虑了摩根(Morgan)、扭转(Torsion)、ToxPrint 和类似物识别方法(Analog Identification Methodology,AIM)这四种化学指纹。随后,他们将得到的最优混合指纹应用于另外两个体内毒性数据集,以此来评估其性能和通用性。

研究人员主要运用了以下关键技术方法:首先,利用分布式结构可搜索毒性数据库(DSSTox)中的化学物质标识符(DTXSID),从数据库中检索化学结构信息,并以简化分子输入线输入系统(SMILES)数据为输入生成化学结构指纹;其次,通过网格搜索和交叉验证(cross - validation)对包含 5830 种化学物质的大鼠急性经口毒性数据集进行分析,以调整混合指纹的权重超参数。

下面来看具体的研究结果:

  • 混合指纹性能评估:在对 5830 种化学物质的大鼠急性经口毒性(LD50)数据集进行网格搜索和交叉验证时,得到了一种最优的混合指纹组合,即摩根指纹占比 52.12% 、ToxPrint 占比 23.40% 、AIM 占比 12.44% 、扭转指纹占比 12.04%。在交叉验证的所有 10 折中,这种混合指纹的表现均优于摩根指纹,混合指纹的平均测试集决定系数(R2)为 0.557,而摩根指纹仅为 0.517。
  • 对其他数据集的预测:研究人员将该混合指纹应用于另外两个数据集。在包含 3266 种化学物质的口服慢性人类等效基准剂量值数据集上,混合指纹的平均测试集 R2为 0.445,摩根指纹为 0.417;在包含 9443 种化学物质的急性哺乳动物经口危害分类数据集上,混合指纹的平均平衡准确率(BA)为 0.577,摩根指纹为 0.553。这表明使用针对急性毒性数据集调整的混合指纹,在不同的体内毒性预测任务中,性能都有所提升。

研究结论表明,通过对混合指纹的探索,研究人员找到了一种能够提升广义跨读预测性能的方法。使用 GenRA 中的自定义混合选项,相对于当前的默认设置,能显著提高跨读预测的准确性。这一研究成果为在 GenRA 应用中选择合适的指纹权重提供了指导原则,有助于更准确地评估化学物质的体内毒性,对于环境健康和毒理学研究领域具有重要意义,该研究成果发表在《Computational Toxicology》上。它为后续的化学品危害评估工作提供了新的思路和方法,有望推动整个领域朝着更高效、更准确的方向发展,在保障人类健康和环境安全方面发挥重要作用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号