
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于ToxCast生物测定数据与机器学习模型预测消费品中杀菌剂的发育和生殖毒性
【字体: 大 中 小 】 时间:2025年06月19日 来源:Environment International 10.3
编辑推荐:
为解决消费品中杀菌剂发育和生殖毒性(DART)评估数据不足的问题,研究人员整合ToxCast生物测定数据与机器学习模型,筛选出25个与体内DART显著相关的生物标志物检测方法,并构建预测模型,对398种消费品杀菌剂进行优先级排序,预测准确率达76.2%。该研究为填补数据缺口、减少动物实验提供了新策略。
随着消费品中杀菌剂的广泛应用,其潜在的发育和生殖毒性(DART)成为监管焦点。然而,传统DART评估依赖耗时耗力的动物实验,且740余种韩国K-BPR列管杀菌剂中61%缺乏体内数据。美国环保署(EPA)的ToxCast数据库虽涵盖9000余种化学物的高通量筛选(HTS)数据,但单一生化检测与体内毒性的相关性存疑。如何利用这些数据建立可靠的预测模型,成为解决监管需求的关键挑战。
韩国研究人员通过整合美国国家毒理学计划(NTP)的Integrated Chemical Environment(ICE)数据库,筛选出201个DART相关机制注释的ToxCast检测方法。利用ToxRefDB体内数据验证后,发现25个检测方法(如血管内皮生长因子受体3检测NVS_ENZ_hVEGFR3、雌激素反应元件检测ATG_ERE_CIS_up)与体内DART数据显著相关(p<0.05)。为扩大化学覆盖范围,研究团队采用随机森林、XGBoost等5种算法,结合MACCS、Morgan等分子指纹特征,构建机器学习模型,最高F1值达0.8。
3.1. 毒性检测方法验证
通过点二列相关和Pearson相关分析,血管生成相关检测BSK_hDFCGF_VCAM1_down与体内数据相关系数达0.60(p=0.008),而细胞外基质检测BSK_KF3CT_TIMP2_down为0.62(p=0.025)。值得注意的是,样本量>200的检测普遍呈现弱相关(r=0.1-0.2),提示单一检测预测局限性。
3.2. 机器学习模型构建
针对数据不平衡问题(阴性样本占比高),最优模型在雌激素受体检测TOX21_ERa_LUC_VM7_Agonist中取得AUC-ROC 0.86,但F1值仅0.74。孕酮代谢检测CEETOX_H295R_OHPROG_up的决策树模型召回率达0.91,凸显模型捕捉阳性样本的能力。
3.3. 杀菌剂风险评估
在398种消费品杀菌剂中,二甲基二辛基氯化铵(DDAC)等100种物质被列为高风险,其中苯扎氯铵(CAS 121-54-0)在12个检测中呈阳性,斑马鱼实验证实其延迟孵化效应。值得注意的是,维生素D3
(CAS 67-97-0)虽通过欧盟BPR评估,但模型提示其可能通过雌激素受体途径引发DART,现有风险评估或存盲区。
该研究开创性地将机制注释的ToxCast检测与机器学习结合,首次系统性评估了消费品杀菌剂的DART风险。尽管模型性能受数据不平衡限制,但76.2%的总体预测准确率为监管优先排序提供了科学依据。特别重要的是,研究揭示了现有风险评估中可能被低估的物质(如维生素D3
),为完善生物杀灭剂法规提供了新视角。未来整合转录组学(HTTr)和暴露组学(ExpoCast)数据,有望进一步提升预测可靠性,推动下一代风险评估(NGRA)发展。
生物通微信公众号
知名企业招聘