编辑推荐:
当前作物建模评估方法多样,致跨模型不确定性比较困难。研究人员采用含 MCMC 和 BMA 的标准化框架,量化比较 4 种建模方法(单模型仅考虑偏差、单模型考虑偏差 + 参数不确定性、多模型集合考虑偏差 + 参数 + 结构不确定性、多模型集合考虑偏差 + 参数 + 结构 + 输入不确定性)的不确定性。发现单一模型易低估不确定性,e-BMA 更可靠,为数字农业决策提供新工具。
在农业生产与自然资源管理的舞台上,作物模型宛如一位智慧的 “参谋”,肩负着预测作物产量、辅助田间管理决策、评估气候变化影响等重任。然而,当前作物建模领域却如同一个缺乏统一规则的 “混乱战场”:不同研究中不确定性量化方法五花八门,有的研究仅用单一过程模型且忽略结构不确定性,有的则假定模型预测无方差,这无疑会高估模型可靠性,为农业决策埋下风险隐患。更棘手的是,即便针对同一模型和不确定因素,不同算法对不确定性的估算结果也大相径庭,使得跨模型、跨研究的公平比较难上加难。在这样的背景下,建立一个标准化的评估框架,科学量化不同建模方法的预测不确定性,成为破解农业决策中模型选择与可靠性判断难题的关键。
为了攻克这一挑战,来自国内多所科研机构的研究人员展开了深入研究。他们的成果发表在《Agricultural and Forest Meteorology》上。
研究人员构建了一个整合马尔可夫链蒙特卡罗(Markov Chain Monte Carlo,MCMC)和贝叶斯模型平均(Bayesian Model Averaging,BMA)的贝叶斯框架,以亚洲水稻数据集为研究对象,对四种不同的作物建模实践进行了系统的不确定性量化与比较。这四种建模实践分别是:1)使用单一模型,仅考虑模型偏差带来的不确定性;2)使用单一模型,同时考虑模型偏差和参数不确定性;3)采用多模型集合(multi-model ensemble,MME),涵盖模型偏差、参数不确定性和结构不确定性;4)运用多模型集合,全面考虑模型偏差、参数、结构以及输入因素引发的不确定性。
研究中主要采用的关键技术方法包括:利用 MCMC 算法对参数向量的后验分布进行估计,借助 BMA 实现模型平均,通过均方根误差(RMSE)量化不同建模实践和预测因子的偏差,以此确保在相同数据集和方法下对各建模实践的偏差进行公平比较。
框架构建与不确定性定义
研究首先构建了观测值与模拟值的一般关系方程 Y=f(X;θ)+e,其中 Y 为预测变量的观测值,f(X;θ) 为基于模型结构 f、输入 X 和参数 θ 的模拟值,e 为衡量模拟与观测差异的模型误差,并将预测不确定性定义为误差 e 的分布,其核心目标是对这一分布进行估计,而该分布取决于模型结构、参数、输入等多种因素的分布情况。
不同建模实践的偏差量化
通过 RMSE 对各建模实践的偏差进行量化分析发现,预测因子的准确性在很大程度上受到校准过程的影响。在本研究中,采用相同的 MCMC 方法和数据集,为不同建模实践的偏差比较奠定了公平基础。结果显示,单一模型仅考虑偏差时,其预测的不确定性被显著低估,而多模型集合由于综合考虑了更多的不确定性来源,在偏差控制方面表现更优。
建模实践的前景分析
传统的作物模型评估大多聚焦于确定性误差,然而,理解误差的概率分布(即预测不确定性)对于农业政策制定和关键决策同样至关重要。引入不确定性视角能够让我们以概率思维审视农业生产,这相较于单纯的确定性方法更具合理性和风险意识。尽管作物物候期或产量建模误差可能不会立即导致重大损失,但在气候变化加剧、农业面临更多不确定性的当下,准确量化不确定性是实现科学决策的前提。
结论与讨论
本研究揭示了当前作物建模研究中不确定性量化缺乏标准化的现状。通过统一的贝叶斯框架对四种建模实践进行比较发现,单个模型的预测不确定性因所采用的预测因子不同而存在显著差异:抽穗期的不确定性范围在 ±6 至 ±36 天之间,成熟期在 ±19 至 ±54 天之间,产量则在 ±1.5 至 ±4.5 吨 / 公顷之间。其中,仅考虑模型偏差的单一模型(实践 1)往往会低估预测不确定性,在关键决策场景中依赖单一基于过程的模型面临着巨大风险。与之形成鲜明对比的是,基于 BMA 的集合预测器(e-BMA)展现出更高的可靠性,成为未来决策支持的理想选择。
这项研究的重要意义在于,其提出的贝叶斯框架为作物模型的评估提供了更稳健、更具适应性的方法,能够针对不同项目的具体需求提供精准的决策支持,为数字农业的发展注入了新的活力。它不仅有助于农业从业者更科学地选择模型、评估预测结果的可靠性,也为应对气候变化下的农业生产挑战提供了有力的工具支撑,推动农业决策从 “经验驱动” 向 “数据与科学驱动” 的范式转变。