
-
生物通官微
陪你抓住生命科技
跳动的脉搏
DART Predictor:一种多标签注意力模型,用于高效筛选具有发育和生殖毒性的化学物质(DART)
《Environmental Science & Technology》:DART Predictor: A Multi-Label Attention Model for High-Throughput Screening of Chemicals with Developmental and Reproductive Toxicity (DART)
【字体: 大 中 小 】 时间:2025年11月14日 来源:Environmental Science & Technology 11.3
编辑推荐:
针对发育和生殖毒性(DART)化学品的快速准确识别需求,本研究提出DART Predictor多标签深度学习模型。该模型采用标签感知注意力机制,整合分子特征与暴露参数,实现六个DART结局的高效预测(平均AUC 0.964,召回率0.923)。经外部验证,模型解释性及泛化性优异(AUC 0.889,召回率0.959),暴露参数提升AUC达8.6%。模型已部署至云平台,为DART风险评估提供新方法。

具有发育和生殖毒性的化学物质(DART)对人类健康构成重大风险,尤其是在胚胎和胎儿发育的关键时期接触这些物质时。因此,迫切需要快速准确地识别这类化学物质。现有的预测模型主要局限于二元分类,并且缺乏对暴露信息的有效整合,这阻碍了在现实暴露情景下进行精确的风险评估。在这里,我们提出了DART Predictor,这是一种采用基于标签的注意力机制进行训练的多标签深度学习模型,能够预测六种DART相关结果(生长障碍、畸形、胎儿存活能力丧失、母体系统毒性、母体病理变化以及生育能力受损)。该模型基于25,175条包含分子描述符和生物测定活性特征的化学数据记录进行训练,这些数据记录经过了与暴露参数的校准。在两个外部验证数据集上,DART Predictor展现了先进的性能(平均AUC:0.964,平均召回率:0.923),同时具备良好的可解释性和泛化能力(AUC:0.889,召回率:0.959)。暴露参数的使用使模型在多个DART结果上的性能提升了高达8.6%,表明真实暴露信息对模型改进至关重要。DART Predictor还被部署到了一个云平台上(http://www.ai4environ.cn/dartpredictor),以提供高通量筛选服务。我们的研究为基于暴露信息的DART风险评估提供了一个新的框架,推动了相关新方法论的发展。
生物通微信公众号
知名企业招聘