DNA损伤结果的预测建模:利用增强型机器学习技术对突变决定因素进行分类

《Chemical Research in Toxicology》:Predictive Modeling of DNA Damage Outcomes: Classification of Mutational Determinants Using Augmented Machine Learning Techniques

【字体: 时间:2025年10月22日 来源:Chemical Research in Toxicology 3.8

编辑推荐:

  DNA加合物和无嘌呤位点突变结果预测研究基于机器学习模型,通过合成数据增强模型准确性,BT-VAE模型使预测准确率提升40%,SVM模型表现最佳,可输入加合物大小、聚合酶及邻近碱基预测突变类型。

  
摘要图片

由于持续的化学攻击导致的DNA损伤所引发的突变结果,受到多种因素的影响,包括损伤的结构和性质、复制过程以及体内的修复机制。现有体外和体内研究清楚地表明了加合物的大小、加合物两侧的碱基以及参与复制过程的聚合酶类型在这些过程中的作用。在这项研究中,我们开发了机器学习方法来预测加合物在特定序列背景下与聚合酶相互作用时导致突变的结果的关键参数。我们使用了三种不同的分类模型进行数据分析:逻辑回归(LR)、决策树(DT)和支持向量机(SVM)。利用文献中的数据,我们使用共价DNA加合物和碱基缺失位点的突变结果来训练这些分类模型。随后,我们结合DNA损伤结构、聚合酶和序列背景的已知信息,利用生成网络方法生成了能够准确反映真实数据的合成数据。此外,我们还采用了极端梯度提升分类器(Extreme Gradient Boosting Classifier)来确定最显著影响DNA突变结果的参数。通过准确率、灵敏度、精确度、F1分数和AUC值等指标来评估各种分类方法的性能。所提出的自举变分自动编码器(Bootstrapped-Variational Autoencoder,BT-VAE)模型将分类器的整体预测准确性提高了40%。在所有评估的分类模型中,SVM模型在预测突变结果方面表现最佳。通过输入致癌物/共价DNA加合物的大小、聚合酶的信息以及两侧碱基的信息,BT-VAE框架能够预测突变结果(对于共价DNA加合物来说是匹配还是不匹配,对于碱基缺失位点是腺嘌呤还是非腺嘌呤),为毒理学领域的体内和体外研究提供了额外的工具。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号