利用可解释的人工智能进行向日葵产量建模:半个世纪以来美国向日葵生产中历史天气因素的影响

《Agronomy Journal》:Sunflower yield modeling with explainable artificial intelligence: Historical weather impacts across half a century of American production

【字体: 时间:2025年10月28日 来源:Agronomy Journal 2

编辑推荐:

  向日葵产量受气候条件影响的可解释人工智能分析显示,七月和八月高温(超过27.5℃)及干旱(降水低于85毫米)是主要减产因素,同时春夏季(五月)和秋末(九月)低温亦导致产量下降。研究整合1976-2022年县数据与气象数据,利用随机森林、梯度提升机等模型识别关键阈值,发现全国模型RMSE为597kg/ha,州级模型表现各异。气候变量间非线性关系通过ALED分析可视化,为农业适应气候变化提供决策依据。

  该研究采用可解释性人工智能(XAI)技术,深入分析了美国境内油菜花(Helianthus annuus L.)产量在不同年份间的变化,并探讨了这种变化与气候因素之间的关系。油菜花作为全球重要的油料作物之一,在美国的生产范围主要集中在七个州,包括北达科他州、南达科他州、堪萨斯州、内布拉斯加州、科罗拉多州、明尼苏达州和德克萨斯州。这些州的气候条件对油菜花的生长和产量有着深远的影响,因此理解这些气候变量如何影响产量,对于制定适应气候变化的农业管理策略具有重要意义。

研究利用了从1976年至2022年的县一级油菜花产量数据,并结合了同期的月度气象数据,包括最大温度、最小温度和总降水量。这些数据来源涵盖了广泛的地理和时间范围,使得研究人员能够从宏观角度识别出影响油菜花产量的关键气候因素。通过整合这些数据,研究团队使用了多种机器学习算法,包括随机森林(RF)、梯度提升机(GBM)和极端梯度提升(XGB),以评估不同模型在预测产量方面的表现。此外,研究还引入了可解释性人工智能的方法,如累积局部效应(ALE)分析,以揭示模型预测背后的气候驱动因素。

在分析过程中,研究人员发现,夏季的极端高温和干旱是影响油菜花产量的主要因素。具体而言,7月和8月的最大温度以及总降水量对产量的影响尤为显著。当7月降水量超过85毫米时,产量趋于稳定;而低于这一阈值时,产量会出现急剧下降。同样,7月的最大温度在27.5°C以内时,产量较高;当温度超过这一范围时,产量会迅速减少。这些发现与现有的农业知识相吻合,表明在油菜花的生长关键阶段,如开花和授粉期,高温和干旱会对产量造成严重负面影响。

除了夏季的气候条件,研究还发现春季和秋季的温度变化同样对油菜花产量有重要影响。在春季种植和立苗阶段(5月至6月),温度过低会导致产量下降;而在秋季成熟和收获阶段(9月至10月),温度过低也可能影响产量,这可能与霜冻或热量不足有关。冬季的降水和温度也被认为是影响产量的重要因素,尤其是在那些冬季湿润的地区,降水有助于提高产量。这表明,尽管油菜花主要依赖夏季的气候条件,但其生长周期的其他阶段同样受到气候因素的影响。

研究还发现,不同州的油菜花产量对气候变量的敏感性存在差异。例如,在北达科他州和南达科他州,使用随机森林算法的国家模型表现优于州级模型,而在内布拉斯加州和德克萨斯州,州级模型的预测能力更高。这可能与各州的气候条件、土壤特性以及农业实践的多样性有关。例如,在德克萨斯州,模型预测的不确定性较高,这可能反映了该州数据量较少或气候驱动因素的重要性随时间发生了变化。

此外,研究还强调了可解释性人工智能在农业领域的应用价值。传统的“黑箱”机器学习模型虽然在预测能力上表现优异,但其内部机制难以解释,这限制了它们在实际应用中的可操作性和可验证性。通过引入ALE等可解释性工具,研究人员能够更清晰地展示模型预测的依据,从而帮助农民和政策制定者更好地理解产量变化的原因,并据此制定适应性措施。这种透明度不仅提高了模型的可信度,也为农业决策提供了更可靠的科学依据。

在实际应用中,研究结果为农业管理提供了重要的参考。例如,了解油菜花对特定气候条件的敏感性,可以帮助农民选择合适的种植时间和地点,优化灌溉和施肥策略,以减少气候变化带来的负面影响。同时,这些结果也为政策制定者提供了数据支持,使他们能够制定更加精准的农业支持政策,促进农业可持续发展。

研究还指出,虽然当前模型主要依赖气候数据,但未来的产量预测可以进一步整合其他关键因素,如土壤特性、农业管理实践和病虫害情况等。例如,土壤类型、肥力和水分保持能力等土壤特性对油菜花的生长和产量有着不可忽视的影响。农业管理实践,如播种密度、施肥量和灌溉方式,同样会影响产量。此外,病虫害的爆发和防治措施也是影响产量的重要因素。因此,未来的模型应考虑这些多维因素,以提高预测的准确性和全面性。

研究团队还提到,虽然当前的模型已经能够解释超过10%的产量年际变化,但在某些州,如内布拉斯加和南达科他州,模型的解释能力更高,能够解释超过23%和31%的产量变化。这表明,随着更多数据的积累和更复杂的模型的开发,XAI在农业领域的应用前景广阔。通过结合不同数据源,如土壤数据、农业实践数据和病虫害数据,可以进一步提升模型的预测能力和解释性,从而更好地服务于农业生产。

总体而言,该研究不仅揭示了油菜花产量与气候变量之间的复杂关系,还展示了可解释性人工智能在农业预测中的重要价值。通过透明化模型的预测机制,研究人员能够为农民和政策制定者提供更加实用的决策支持,帮助他们应对气候变化带来的挑战。同时,该研究也为未来农业研究指明了方向,即在提高预测精度的同时,注重模型的可解释性,以确保其在实际应用中的可靠性和有效性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号