建立信任:在农业应用中验证人工智能(AI)和机器学习的有效性
《Journal of Agricultural and Food Chemistry》:Building Trust: Validating Artificial Intelligence (AI) and Machine Learning in Agricultural Applications
【字体:
大
中
小
】
时间:2025年12月29日
来源:Journal of Agricultural and Food Chemistry 6.2
编辑推荐:
AI与ML在农业科学中的应用涵盖数据治理、模型验证与法规整合,通过FAIR原则、DAMA-DMBOK等框架提升可靠性,并展示了herbicides发现、PROTACs设计及农药残留预测等案例。
在2025年秋季的美国化学会(ACS)会议上,农业化学品(AGRO)和化学信息(CINF)分会联合举办了一场研讨会,邀请了国际专家探讨将人工智能(AI)和机器学习(ML)整合到农业科学中的机遇与挑战。AI和ML通过实现作物产量和农药残留的预测建模、遥感技术、精准农业、自动化表型分析、决策支持系统以及供应链优化等方式正在改变农业。这些应用得到了诸如FAIR数据原则、数据管理框架DAMA-DMBOK以及广泛采用的机器学习库和平台(TensorFlow、PyTorch和Scikit-learn)等技术的支持。尽管AI和ML取得了显著进展,但其普及尤其是在监管领域,不仅依赖于技术创新,还依赖于通过严格的验证、透明的数据实践和可重复的工作流程来建立信任。这种信任是通过实施实用的、基于系统的策略建立的,包括严格的程序、清晰的文档记录、统一的数据管理和标准化的方法。
**表1. 可靠的AI和ML开发的最佳实践与参考文献**
**最佳实践:**
- (A)数据整理与基础设施构建
- 为学术界、监管机构和行业提供共同遵守的定义和标准,以确保数据的可转移性和可重用性(1)
- 采用通用的数据定义和标准,统一数据格式和元数据,并参考相关框架(如FAIR原则)
- 实施稳健的数据管理,这对于扩展AI应用至关重要(2)
- 使用全面的数据管理框架(如DAMA-DMBOK),记录数据来源和处理过程,整合多种数据类型(调查数据、卫星数据、地理空间数据和实验数据),并执行严格的数据清洗和特征工程
- (B)AI工作流程的验证
- 遵循系统化的最佳实践,确保AI工作流程的可靠性和可重复性(13)
- 关键实践包括:结构化验证、透明文档记录、集成验证方法、审计追踪以及统一的数据处理流程
- 超出性能指标的评估:量化用户对AI应用的信任度和采纳程度(14)
- 关键实践包括:收集用户对可靠性、透明度和可用性的反馈;跟踪实际应用情况;使用可解释性工具;使用独立数据集进行验证;并尽早与利益相关者沟通
- (C)与法规的协调
- 欧洲食品安全局(EFSA)鼓励符合欧盟法律的工作流程的AI开发(15)
- 关键实践包括:根据欧盟标准进行验证,确保透明度和可解释性,建立健全的治理机制,进行风险评估和缓解措施,监控和更新模型,并与利益相关者沟通
- 美国环境保护署(EPA)支持负责任的AI发展,强调风险管理、合规性和透明治理(16,17)
- 关键实践包括:遵循联邦指导方针(如OMB M-25-21),在整个AI生命周期内管理风险,保持透明的治理和文档记录,确保合规性和可审计性,定期审查和更新系统,并与利益相关者互动
**数据整理与基础设施**
可靠的AI和ML系统始于全面的数据策略,这包括细致的数据整理、组织、清洗、整合多种数据来源,以及建立稳健的基础设施、技术框架和工具,以便可靠地存储、管理和处理数据。研讨会强调了数据策略在实现可靠AI和ML结果中的关键作用。会上介绍了一种整合多种数据来源(调查数据、卫星数据、地理空间数据和实验数据)的框架,并与NASA和ESA等机构的不断发展的标准保持一致。这种方法确保了互操作性和可靠的训练数据,为通过整理的数据集和稳健的基础设施获得监管机构的认可奠定了基础。进一步的研究基于这些训练数据,利用模型集成来预测土壤的碳容量,并使用了一套稳健的验证指标来公平透明地比较这些模型。另一个研究强调了数据策略的重要性,包括数据集和建模工作流程的可重复性和一致性。此外,还强调了种子、数据分割和模型参数的清晰文档记录对于公平比较和独立复制研究的重要性,从而支持开发出可靠且透明的农业应用ML模型。
**AI和ML在产品发现中的应用**
AI和ML的进步正在加速更安全、更可持续的农业化学品的发现,即使在实验数据有限的情况下也能提供有前景的候选化合物。这些例子展示了AI驱动的发现系统如何提高农业产品发现流程的效率。一种方法结合深度学习、插补技术和多参数优化来加速大豆和玉米中阔叶杂草的新除草剂的发现。通过利用多个物种中稀疏、噪声较大的实验数据之间的相关性,这种方法有效地填补了数据集中的空白,使得未来的模型能够基于此进行公平的基准测试。另一个例子展示了数据策略的重要性,包括数据集和建模工作流程的可重复性和一致性。此外,还强调了种子、数据分割和模型参数的清晰文档记录对于公平比较和独立复制研究的重要性,从而支持开发出可靠且透明的农业应用ML模型。
**AI和ML在产品开发中的应用**
AI和ML在农业产品开发中变得越来越重要,支持诸如残留物分析、环境风险评估、配方优化和田间试验设计等活动。然而,其在开发中的接受程度取决于严格的验证和与不断发展的行业最佳实践的协调(表1)。以下农药残留物应用案例说明了AI和ML的最佳实践如何为产品开发中的监管整合铺平道路。一项研究开发了一个预测模型,用于估计玉米中的潜在残留物水平,该模型采用了严谨的特征工程和数据清洗方法。该模型的性能通过交叉验证和标准评估指标进行了评估,显示出在产品标签优化方面的潜力。另一项研究引入了集成随机森林模型,用于计算机模拟预测可脱落的叶面残留物,为分层重新进入暴露评估提供了路线图。该模型的性能通过交叉验证和标准评估指标得到了验证,证明了其在监管应用中的可靠性和可扩展性。在其他研究中,开发了一种使用数据提取工具的AI工作流程来评估农药分析方法。通过与专家的不一致矩阵进行交叉验证,直接比较了AI输出与专家共识的结果,表明AI工作流程的准确性几乎与专家评估相当,简化了方法评估过程。
**新兴技术和未来方向**
AI和ML在农业领域的未来正受到快速技术创新以及对于严格验证、透明度和监管协调的集体承诺的推动。随着学术界和行业在数据收集、模型验证和预测分析方面不断协调最佳实践,监管机构能够更好地共同设计和创建应对现代农业复杂性的AI驱动工具和应用。随着透明度、评估和性能标准的不断进步,这些协作努力将为监管批准的系统开辟新的机会,并加速AI和ML在农业创新各个阶段的负责任应用。同时,包括生成化学平台(如Chemistry42和PandaOmics)、先进材料分析工具(ChemSpace Analyzer)、下一代ADME建模(pkCSM和ADMETlab)以及AI驱动的遥感技术(ArcGIS和FlyPix)在内的新兴技术正在迅速扩展技术边界。技术进步与对质量和透明度的坚定承诺相结合,正在塑造一个AI和ML将为农业最紧迫的挑战提供可靠、可持续和有影响力的解决方案的未来。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号