食品安全是国家和社会可持续发展的关键要素,已成为世界各国政策议程的核心关注点。准确预测作物质量和产量对于优化农艺管理、制定农业保险政策和制定金融策略至关重要(Basso和Liu,2019;Gyawali等人,2018;Song等人,2023;Yue等人,2018)。小麦(Triticum aestivum L)是全球最重要的主食作物之一,为近40%的世界人口提供必需的热量和蛋白质(Cai等人,2019;Wan等人,2020)。在中国,冬小麦占总粮食产量的85%(Cao等人,2020;Huang等人,2015),因此对食品安全、经济增长和农业生产至关重要(Beyene等人,2022;Erenstein等人,2022;Reynolds等人,2022)。鉴于气候变化的日益影响,获取大规模的冬小麦生产数据对于确保食品安全和可持续发展至关重要(Zheng和Zhang,2025a)。近年来,市场需求逐渐从关注简单供应转向重视质量(Song等人,2023)。虽然以往的研究主要集中在估算小麦产量上(Chaudhari等人,2025;Xiao等人,2024;Yu等人,2025),但食品质量评估的重要性得到了更多的认可(Fu等人,2022;Liu等人,2019;Longmire等人,2023;Longmire等人,2024;Xu等人,2024;Zheng等人,2024)。质量不仅影响消费者需求和市场竞争力,还直接影响生产系统的经济效益(Khanal等人,2020)。
谷物蛋白质含量(GPC)是小麦质量的关键指标,受多种因素影响,包括小麦品种、气候和土壤条件,其中气象因素起着特别重要的作用(Pan等人,2006;Song等人,2019)。许多研究探讨了气候条件对冬小麦GPC的影响,发现温度、辐射和降水量都会影响小麦的蛋白质含量(Song等人,2019;Vollmer和Mu?hoff,2018;Xu等人,2020)。因此,了解小麦GPC的分布模式具有重要的科学意义,并在经济和实际应用中具有重大价值。
目前,许多研究使用单一数学模型和机器学习技术来模拟小麦GPC和产量。传统的作物产量预测方法主要依赖于统计分析和基于过程的作物模型。其中,基于统计分析的经验模型因其在评估气候变量与作物生长关系方面的有效性而被广泛使用(Sharma等人,2022;Sun等人,2024;Tao等人,2012;Xu等人,2024;Zhang等人,2017)。然而,经验模型存在显著局限性,特别是在处理气候变量之间的多重共线性时,这可能会引入对气候与作物关系理解的偏差(Li等人,2020;Wang等人,2022)。因此,在面对日益严重的气候变化时,这些模型往往难以准确捕捉气候与作物之间的复杂相互作用,导致预测精度降低。
由于机器学习模型能够模拟多个影响因素之间的非线性关系,其预测精度通常高于传统的基于回归的方法(Cai等人,2019;Palanivel和Surianarayanan,2019;Sun等人,2022),因此越来越多地被采用。许多研究证明了它们在作物生长和产量估算方面的有效性(Clauss等人,2018;Iniyan等人,2023;Kamilaris和Prenafeta-Boldú,2018;Longmire等人,2024;Longmire等人,2023;Longmire等人,2022;Maimaitijiang等人,2020;Park等人,2018;Ruan等人,2022;Singh等人,2023;Sun等人,2020;Sun等人,2022;Tian等人,2021;Xiao等人,2019)。然而,机器学习模型的解释性有限仍是一个主要缺点,因为它们的黑箱性质限制了对机制的理解和更广泛的应用。
基于过程的作物模型通过明确表示受气候、土壤、基因型和管理因素调控的生理过程来模拟作物生长(Bai等人,2024;Chapagain等人,2022;Chen和Tao,2022;Chenu等人,2017;Dhillon等人,2023;Jin等人,2022;Rajasivaranjan等人,2022)。由于其强大的机制基础,这些模型具有高解释性,能够有效捕捉作物对环境和管理变化的响应(Gilardelli等人,2019;Jin等人,2022;Mokhtari等人,2018;Wu等人,2021b;Xie等人,2017;Zhang等人,2020;Zheng等人,2025a;Zheng和Zhang,2023;Zhuo等人,2022)。然而,许多作物模型对质量形成的表示过于简化或不完整,并且需要大量参数,这些参数在区域尺度上难以准确指定(Brisson等人,2003;Martre等人,2006;Wallach等人,2023;Zheng和Zhang,2025b)。此外,它们在极端天气条件下的稳健性和预测能力仍然有限。
为了解决这些局限性,提出了将作物模型与机器学习相结合的混合方法,利用作物模型的机制优势和机器学习的数据驱动灵活性(Feng等人,2019;Li等人,2021;Li等人,2023a)。这些混合框架在气候极端条件下显示出改进的产量预测精度和降低的不确定性。然而,应用于GPC模拟的研究仍然较少,目前尚未就最适合表示作物生长和质量过程的机器学习方法达成共识。
为了进一步提高模型结果的准确性,提出了多模型集成(MME)方法,在许多情况下其性能优于单一模型(Martre等人,2015;Mustafa等人,2020;Wallach等人,2018)。MME通过整合多个模型的输出来提高预测性能并评估不确定性(Wallach等人,2018)。然而,传统的MME方法(如简单平均和线性回归)通常依赖任意权重来确定模型组合,这可能会降低可靠性(Duan等人,2007;Raftery等人,2005)。赤池信息量准则(AIC)提供了一种统计上稳健的模型加权方法(Akaike,1973;Portet,2020)。AIC量化了模型拟合优度和复杂性之间的权衡,允许表现更好、过拟合风险较低的模型获得更高的权重(Burnham和Anderson,2002;Portet,2020)。最近的研究表明,基于AIC的加权可以有效整合来自不同模型的预测,并提高包括水文学、生态学和气候影响评估在内的各种领域的模拟精度(Gao等人,2021;Li等人,2024;Zhao等人,2022;Zheng和Zhang,2023)。
准确预测小麦GPC和产量仍然是一个主要挑战,尤其是在气候变异性增加和极端天气事件频率上升的情况下。为了解决这一挑战,本研究结合了基于过程的作物模型、机器学习算法和AIC加权模型平均(AIC-WMA)集成框架。通过纳入遥感数据和极端气候指数,更好地捕捉作物生长动态和胁迫响应。具体目标是:(1)校准和验证APSIM-NG(农业生产系统模拟器-下一代)模型以模拟冬小麦GPC和产量;(2)通过将作物模型输出与机器学习方法结合,并借助遥感信息和极端气候指数,提高冬小麦GPC和产量的模拟精度;(3)使用简单模型平均(SMA)和AIC-WMA开发多模型集成框架,进一步提高预测性能并降低模型不确定性。总体而言,本研究旨在建立一个稳健且可解释的框架,以在气候极端条件下改进小麦质量和产量预测,对区域尺度的作物管理和气候适应策略具有重要意义。