机器学习驱动的眼刺激性毒性预测:计算与实验整合研究

【字体: 时间:2025年07月04日 来源:Toxicology and Applied Pharmacology 3.3

编辑推荐:

  为解决传统动物实验伦理争议及预测准确性不足的问题,研究人员通过整合机器学习(ML)与体外实验验证,构建了首个眼刺激性(EI)毒性评估框架。基于5220种化合物的分子指纹(11种)和分子描述符(13种),采用六种ML算法开发了252个模型,最优模型测试集准确率达0.977,并通过体外角膜上皮实验验证了预测可靠性。该研究为符合3Rs原则(替代、减少、优化)的下一代化学安全评估提供了范式。

  

眼睛作为人体最敏感的器官之一,日常接触的化学品——从化妆品到农药——可能引发从轻微刺激到永久性失明的严重后果。传统评估依赖备受争议的Draize兔眼实验,尽管OECD已推动牛角膜透明度测试等替代方案,但跨物种差异和机制解析不足仍是瓶颈。近年来,机器学习(ML)和定量构效关系(QSAR)模型虽取得进展,但预测与生物学验证间的鸿沟始终存在。

四川省科技计划等项目支持的研究团队在《Toxicology and Applied Pharmacology》发表研究,提出“计算-实验”闭环策略。他们整合4175种化合物的多维数据(11种分子指纹+13种分子描述符),通过六种ML算法构建252个模型,经五折交叉验证筛选出最优模型(RF+KRFP+13MDs组合),测试集准确率高达0.977。体外实验采用重建人角膜上皮模型,生物学响应与预测结果高度一致(κ=0.966)。

关键技术包括:1)化学空间分析(分子量/AlogP分布);2)机器学习建模(随机森林/RF、支持向量机等);3)体外角膜上皮屏障功能检测;4)特征重要性排序(KRFP指纹主导)。

数据收集与准备
通过整合Verma、Kang等多团队数据,经严格去重和类别平衡处理,最终构建含5220种化合物的数据集,涵盖GHS分类的1类(不可逆损伤)和2A/2B类(可逆刺激)。

化学空间分析
分子量(50-500 Da)和脂溶性(AlogP -6至6)分布显示训练集与验证集高度重叠,证实模型泛化能力。KRFP指纹对预测贡献度达47.6%,显著高于其他特征。

结论与意义
该研究实现三大突破:1)通过ML优化特征选择(如KRFP指纹)提升预测可靠性;2)建立“计算预测-实验验证”闭环,替代动物实验;3)加速化学品早期毒性筛查。其ML模型在外部验证中准确率超越前人研究(ΔACC=0.117),且实验验证证实预测与角膜上皮损伤程度强相关。这不仅推动3Rs原则实践,更为化妆品、农药等行业的合规性评估提供高效工具。作者团队特别指出,未来需扩大化合物结构多样性以进一步提升模型普适性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号