食品价格通胀预测在经济规划、社会政策和财政管理中发挥着重要作用。食品价格的飙升会迅速侵蚀家庭的购买力,扰乱财政计划,在极端情况下甚至可能引发社会动荡。全球范围内,食品价格通胀与政治不稳定性的增加有关,尤其是在食品支出占家庭支出较大比例的发展中国家(Barrett和Bellemare,2011;Arezki和Bruckner,2011;Bellemare,2015)。即使在像美国这样的高收入国家,食品价格上涨也会导致食品安全问题加剧,并给安全网计划带来压力(Gregory和Coleman-Jensen,2013)。在这种背景下,准确预测食品价格动态对于实现宏观经济韧性和政策响应性至关重要。
在美国,美国农业部(USDA)的经济研究服务局(ERS)通过其每月发布的《食品价格展望》(FPO)来应对这一需求,该报告提供了各种食品类别的年度通胀预测。这些预测为联邦营养援助计划的预算分配提供了依据,支持农业生产者的供应链规划,并成为公共和私营部门决策的关键输入(Kuhns等人,2015;McLachlan等人,2022)。仅2024财年,联邦补充营养援助计划(SNAP)的支出就达到了998亿美元(Jones,2025),因此政策制定者不仅需要可靠的预测,还需要清楚地了解驱动食品价格变动的经济机制。
USDA在现代化其预测工具包方面取得了进展。目前基于季节性自回归积分移动平均(SARIMA)的方法由McLachlan等人(2022)进行了评估,并于2023年得到实施(Sweitzer等人,2023)。在这些变化之前,FPO的预测依赖于简单的模型,这些模型使用主观的1个百分点范围,且不随预测期限或食品类别而变化(McLachlan等人,2022)。类似的传统方法仍用于预测美国食品系统的其他方面,包括许多农产品,这表明结合更广泛宏观经济信息的方法可能适用于食品消费者价格指数(CPI)之外的领域。最近的研究表明,将自适应模型选择与外生宏观经济变量相结合可以显著提高FPO的预测准确性(MacLachlan等人,2025)。然而,仍有机会探索集成方法如何补充这些方法。
SARIMA模型采用固定参数结构,可能难以捕捉现代食品市场中日益普遍的非线性、结构突变和外部冲击(Hyndman和Khandakar,2008;Joutz等人,2000;MacLachlan等人,2025;Stock和Watson,2007)。基于集成树的方法,如随机森林,具有明显的优势:它们的递归划分结构可以在不预先指定函数形式的情况下捕捉非线性,而跨树的聚合可以减少预测方差。这些特点在与现有方法结合使用时,尤其是在波动环境中,可以提高预测性能(Jung等人,2018;Coulombe,2024)。
本研究提出了一种宏观经济自回归随机森林(MARRF)方法(由Coulombe,2024开发),以补充现有的美国食品价格通胀预测方法。简而言之,MARRF结合了三个关键要素:(i)通过集成树平均来减少方差;(ii)递归划分,无需预先指定阈值即可识别依赖于不同状态的预测关系;(iii)广义时变参数(GTVPs),反映预测变量在不同经济状态下的边际效应变化,从而提高透明度并允许在动态环境中进行时变推断(Breiman,2001;Hastie等人,2009;Coulombe等人,2022;Medeiros等人,2021)。这些特点使MARRF能够适应结构变化——而不仅仅是通过添加额外的预测变量来实现,后者可以通过标准回归方法实现。更重要的是,MARRF框架提供了传统机器学习应用中通常缺乏的经济可解释性。虽然深度神经网络或提升算法可以实现高预测准确性,但它们不透明的非线性架构往往阻碍了对驱动预测的经济机制的有意义理解。
除了捕捉这些演变的关系外,随机森林还能生成变量重要性度量,使研究人员能够识别并排序每个时间点上最具影响力的宏观经济决定因素。该框架还通过变量重要性图表得到了进一步增强,这些图表提供了相关经济领域中非线性效应的可解释可视化表示。因此,MARRF模型不仅生成预测结果,还提供了这些预测结果背后的可解释结构,从而更清晰地揭示了通胀与关键宏观经济指标之间的相互作用。本研究的一个主要贡献是将广泛的宏观经济变量纳入MARRF框架。利用联邦储备经济月度数据(FRED-MD)(McCracken和Ng,2016),我们获得了126个宏观经济和金融时间序列,并应用主成分分析(PCA)提取了总结通胀动态、劳动力市场状况、工业生产和住房活动的潜在因素。
为了评估我们提出的方法的预测性能,我们生成了2003年至2024年每年12个月的平均年同比通胀率的样本外固定事件预测(截至12月)。然后,我们将提出的MARRF模型的预测结果与美国农业部目前实施的基于SARIMA的预测结果进行比较。我们的发现表明,在预测范围内,MARRF和SARIMA模型提供了互补的优势。SARIMA在预测窗口末期的短期预测中表现尤为出色,而MARRF在中期预测中表现更佳。效率测试进一步显示,MARRF预测的误差系统模式较少,尤其是在较长预测期限内减少了SARIMA特有的规模相关效率问题。此外,包含预测的测试表明,每种模型都能捕捉到不同的信息,而简单地将两种预测结果平均化可以在整个预测周期内减少偏差并提高准确性。单一模型无法实现这些结果。准确性评估有助于建立模型可解释特征的可信度:变量重要性剖面显示了劳动力市场指标、工业产出和价格指数等因素在预测期限内的变化贡献。这些可解释的特征具有独立于预测准确性的价值,即使在MARRF表现不如SARIMA的预测期限内,也支持政策分析和预测叙述的制定。GTVP估计揭示了食品价格通胀驱动因素在极端时期(从2008年金融危机到COVID-19时期的家庭债务增加)的动态变化。这种更细致的理解对政策制定者至关重要,有助于更清楚地了解影响食品价格稳定的复杂机制。
本文的其余部分安排如下:第2节回顾了食品价格预测和机器学习在宏观经济中的应用相关文献;第3节描述了数据来源和因变量、自变量的构建;第4节详细介绍了MARRF方法和预测过程;第5节进行了预测性能评估,并对方法的时间变参数和变量重要性度量进行了经济解释;第6节总结了政策含义和未来研究的方向。