利用机器学习开发农药相似性评分体系及模型,以预测分子骨架的农药活性

《ACS Omega》:Development of Pesticide-Likeness Scores and Models for Predicting Pesticide Activity of Molecular Scaffolds with Machine Learning

【字体: 时间:2025年11月10日 来源:ACS Omega 4.3

编辑推荐:

  农药活性预测与分子骨架筛选方法研究。提出独立于目标物种的农药相关性评分,构建基于分子骨架的活性预测模型,并通过逆向分析提出新候选骨架,并利用SHAP方法可视化解释预测机制。

  随着全球人口的增长,预计到2050年,对农业作物的需求将翻倍。然而,当前的全球作物产量仍难以满足这一需求,必须提高60%至110%才能实现供需平衡。农业生产的下降受到杂草和病虫害的严重影响,因此,农药的广泛应用成为提高作物产量和质量的关键手段。农药不仅显著增加了粮食产量,还帮助减少了饥饿人口的数量,其对现代农业的贡献是不可忽视的。然而,传统的农药研发流程效率低下,成本高昂,成功率较低。在此背景下,利用机器学习方法预测农药活性成为一种重要的研究方向。

传统的农药研发通常依赖于研究人员的经验和知识,从大量候选化合物中筛选出具有潜在活性的分子,并在实验室中进行合成与测试。这一过程涉及多个步骤,包括活性测试、毒性评估以及符合政府和其他机构标准的筛选。然而,由于候选化合物数量庞大,而实际能够成功商业化的产品却寥寥无几,整个流程既耗时又费力。为了解决这一问题,研究者们开始探索基于机器学习的预测方法,以加快农药分子的设计与筛选过程。

在这一领域,机器学习模型的应用正在逐步扩展。例如,Nakayama等人通过构建机器学习模型,将分子描述符作为解释变量,农药活性作为目标变量,利用已知活性的化合物预测未知活性化合物的活性。这种方法虽然提高了筛选效率,但仍受限于需要为每种目标物种单独构建模型,因为农药作用的对象包括昆虫、植物、真菌等众多生物体。这种对每种物种单独建模的方式不仅耗费大量资源,还难以满足农药研发的多样化需求。

因此,本研究提出了一种更为全面的农药相似性评分(pesticide-likeness scores)方法,旨在不依赖特定目标物种的情况下,对化合物的结构进行评估。通过构建不依赖目标物种的综合数据集,并使用分类模型预测化合物的活性,最终将预测概率作为农药相似性评分。这一方法不仅简化了模型构建过程,还提高了预测的通用性,使得农药活性预测可以应用于多种目标物种。

为了验证农药相似性评分的有效性,研究者们将其作为分子描述符,应用于农药活性预测模型中,并与传统的分子描述符进行比较。结果显示,使用农药相似性评分的模型预测准确率与传统方法相当,甚至在某些数据集中表现更优。这一发现表明,农药相似性评分可以作为分子描述符的补充,从而提高农药分子设计的效率。

此外,农药的活性在很大程度上受到分子骨架(scaffold)的影响。分子骨架是化合物中具有特征结构的部分,能够影响其与目标生物体的相互作用。某些骨架即使添加不同的官能团,也难以产生有效的农药活性,而另一些骨架则可能在添加不同官能团后表现出较高的活性。因此,在农药分子设计过程中,识别具有高活性的分子骨架至关重要。

本研究通过构建分子骨架与农药活性之间的机器学习模型,提出了一种新的方法来筛选具有潜在活性的分子骨架。研究者们从已知活性的化合物中提取分子骨架,并利用这些骨架作为解释变量,构建预测模型。通过将未知活性的分子骨架输入到这些模型中,研究者们能够预测其活性,并选择具有高预测活性的骨架作为候选。这种方法不仅提高了筛选效率,还为农药分子设计提供了新的思路。

在构建分子骨架活性预测模型的过程中,研究者们使用了多种分子描述符,包括ECFP4、ECFP6和MACCS Keys等。这些描述符能够有效捕捉化合物的结构特征,为模型训练提供丰富的数据支持。通过比较不同分类和回归方法的性能,研究者们选择了最合适的模型进行预测,并对预测结果进行了验证。结果显示,使用分子骨架描述符的模型在预测高活性类别的准确性方面优于传统方法,特别是在处理低活性和中等活性类别时表现更为出色。

为了进一步优化模型性能,研究者们采用了交叉验证(cross-validation)方法,确保模型在不同数据集上的泛化能力。同时,通过特征选择方法(如Boruta和交叉验证特征重要性分析)降低了模型的复杂度,提高了预测的稳定性。这些方法的应用使得农药相似性评分和分子骨架活性预测模型能够在不同数据集上保持较高的预测准确率。

本研究还通过可视化方法对模型的预测结果进行了深入分析。使用SHAP(Shapley Additive Explanations)方法,研究者们能够直观地展示分子骨架中各个原子和键对活性预测的贡献。通过这种可视化手段,研究者们不仅能够理解模型的预测机制,还能够发现某些特定结构对农药活性的促进作用。例如,在训练集和新骨架的可视化结果中,发现氧原子在五元环结构中的贡献为正,而其他环中的氮原子和羟基则表现出不同的贡献模式。这些发现为农药分子设计提供了新的见解,有助于识别具有高活性的结构特征。

通过结合农药相似性评分和分子骨架活性预测模型,本研究提出了一种新的农药分子设计策略。这种方法不仅提高了农药活性预测的效率,还为筛选具有潜在活性的分子骨架提供了科学依据。研究者们认为,这种综合方法能够加速农药的发现过程,降低研发成本,并提高成功率。

在实际应用中,农药相似性评分和分子骨架活性预测模型可以作为农药分子设计的辅助工具。它们能够帮助研究人员快速筛选出具有潜在活性的化合物,减少不必要的实验测试,从而节省时间和资源。同时,这些模型还可以为农药分子设计提供理论支持,使得设计过程更加科学和系统化。

此外,本研究还强调了农药分子设计中的一些关键问题。例如,某些分子骨架即使添加不同的官能团,也难以产生有效的农药活性,因此在设计过程中需要提前排除这些骨架。另一方面,某些骨架具有较高的活性潜力,可以作为未来农药分子设计的重点方向。通过这些方法,研究人员能够更有效地探索农药分子的结构空间,找到具有高活性的骨架。

本研究的成果表明,农药相似性评分和分子骨架活性预测模型在农药分子设计中具有重要的应用价值。它们不仅能够提高预测的准确性,还能够为研究人员提供新的思路和工具,以优化农药分子的设计过程。未来的研究可以进一步探索这些模型的优化方法,例如采用集成学习或降维技术,以提高预测的稳定性和效率。

总的来说,本研究通过引入农药相似性评分和分子骨架活性预测模型,为农药分子设计提供了一种新的解决方案。这些方法不仅提高了农药活性预测的效率,还为筛选具有高活性的分子骨架提供了科学依据。通过结合这些方法,研究人员能够在更短的时间内发现具有潜在活性的农药分子,从而加快农药的研发进程。此外,研究还强调了模型的可解释性,使得农药分子设计过程更加透明和可控。这些成果为未来的农药研究和开发提供了重要的理论支持和技术手段,有助于推动农业生产的可持续发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号