食品价格通胀预测：来自宏观经济自回归随机森林方法的见解

《Food Policy》：Food price inflation forecasting: Insights from a Macroeconomic Auto-Regressive Random Forest approach

【字体：大中小】 时间：2026年06月10日 来源：Food Policy 6

编辑推荐：

　　威廉·麦克威廉姆斯（William McWilliams）|沙马尔·L·斯图尔特（Shamar L. Stewart）|奥尔加·伊森吉尔迪娜·马萨（Olga Isengildina Massa）美国弗吉尼亚理工大学农业与应用经济系，布莱克斯堡，VA 24061 摘要本研究

威廉·麦克威廉姆斯（William McWilliams）|沙马尔·L·斯图尔特（Shamar L. Stewart）|奥尔加·伊森吉尔迪娜·马萨（Olga Isengildina Massa）

美国弗吉尼亚理工大学农业与应用经济系，布莱克斯堡，VA 24061

摘要

本研究提出了一种宏观经济自回归随机森林（MARRF）模型，以补充现有的美国年度食品价格通胀预测方法。该模型利用集成机器学习的灵活性和广义时变参数（GTVPs）的可解释性，整合了从FRED-MD数据库中提取的高维宏观经济信息，从而生成既准确又具有经济意义的预测结果。对2003年至2024年的样本外评估显示，尽管存在信息效率问题，MARRF和SARIMA模型仍具有互补的优势。包含预测的测试证实，每种模型都能捕捉到不同的信息，而简单地将两种模型的预测结果平均化可以在整个预测周期内同时减少偏差并提高准确性——这是单一模型无法实现的。此外，变量重要性指标和时变参数揭示了不同时期和预测范围内食品价格通胀的宏观经济驱动因素的变化。

引言

食品价格通胀预测在经济规划、社会政策和财政管理中发挥着重要作用。食品价格的飙升会迅速侵蚀家庭的购买力，扰乱财政计划，在极端情况下甚至可能引发社会动荡。全球范围内，食品价格通胀与政治不稳定性的增加有关，尤其是在食品支出占家庭支出较大比例的发展中国家（Barrett和Bellemare，2011；Arezki和Bruckner，2011；Bellemare，2015）。即使在像美国这样的高收入国家，食品价格上涨也会导致食品安全问题加剧，并给安全网计划带来压力（Gregory和Coleman-Jensen，2013）。在这种背景下，准确预测食品价格动态对于实现宏观经济韧性和政策响应性至关重要。

在美国，美国农业部（USDA）的经济研究服务局（ERS）通过其每月发布的《食品价格展望》（FPO）来应对这一需求，该报告提供了各种食品类别的年度通胀预测。这些预测为联邦营养援助计划的预算分配提供了依据，支持农业生产者的供应链规划，并成为公共和私营部门决策的关键输入（Kuhns等人，2015；McLachlan等人，2022）。仅2024财年，联邦补充营养援助计划（SNAP）的支出就达到了998亿美元（Jones，2025），因此政策制定者不仅需要可靠的预测，还需要清楚地了解驱动食品价格变动的经济机制。

USDA在现代化其预测工具包方面取得了进展。目前基于季节性自回归积分移动平均（SARIMA）的方法由McLachlan等人（2022）进行了评估，并于2023年得到实施（Sweitzer等人，2023）。在这些变化之前，FPO的预测依赖于简单的模型，这些模型使用主观的1个百分点范围，且不随预测期限或食品类别而变化（McLachlan等人，2022）。类似的传统方法仍用于预测美国食品系统的其他方面，包括许多农产品，这表明结合更广泛宏观经济信息的方法可能适用于食品消费者价格指数（CPI）之外的领域。最近的研究表明，将自适应模型选择与外生宏观经济变量相结合可以显著提高FPO的预测准确性（MacLachlan等人，2025）。然而，仍有机会探索集成方法如何补充这些方法。

SARIMA模型采用固定参数结构，可能难以捕捉现代食品市场中日益普遍的非线性、结构突变和外部冲击（Hyndman和Khandakar，2008；Joutz等人，2000；MacLachlan等人，2025；Stock和Watson，2007）。基于集成树的方法，如随机森林，具有明显的优势：它们的递归划分结构可以在不预先指定函数形式的情况下捕捉非线性，而跨树的聚合可以减少预测方差。这些特点在与现有方法结合使用时，尤其是在波动环境中，可以提高预测性能（Jung等人，2018；Coulombe，2024）。

本研究提出了一种宏观经济自回归随机森林（MARRF）方法（由Coulombe，2024开发），以补充现有的美国食品价格通胀预测方法。简而言之，MARRF结合了三个关键要素：（i）通过集成树平均来减少方差；（ii）递归划分，无需预先指定阈值即可识别依赖于不同状态的预测关系；（iii）广义时变参数（GTVPs），反映预测变量在不同经济状态下的边际效应变化，从而提高透明度并允许在动态环境中进行时变推断（Breiman，2001；Hastie等人，2009；Coulombe等人，2022；Medeiros等人，2021）。这些特点使MARRF能够适应结构变化——而不仅仅是通过添加额外的预测变量来实现，后者可以通过标准回归方法实现。更重要的是，MARRF框架提供了传统机器学习应用中通常缺乏的经济可解释性。虽然深度神经网络或提升算法可以实现高预测准确性，但它们不透明的非线性架构往往阻碍了对驱动预测的经济机制的有意义理解。

除了捕捉这些演变的关系外，随机森林还能生成变量重要性度量，使研究人员能够识别并排序每个时间点上最具影响力的宏观经济决定因素。该框架还通过变量重要性图表得到了进一步增强，这些图表提供了相关经济领域中非线性效应的可解释可视化表示。因此，MARRF模型不仅生成预测结果，还提供了这些预测结果背后的可解释结构，从而更清晰地揭示了通胀与关键宏观经济指标之间的相互作用。本研究的一个主要贡献是将广泛的宏观经济变量纳入MARRF框架。利用联邦储备经济月度数据（FRED-MD）（McCracken和Ng，2016），我们获得了126个宏观经济和金融时间序列，并应用主成分分析（PCA）提取了总结通胀动态、劳动力市场状况、工业生产和住房活动的潜在因素。

为了评估我们提出的方法的预测性能，我们生成了2003年至2024年每年12个月的平均年同比通胀率的样本外固定事件预测（截至12月）。然后，我们将提出的MARRF模型的预测结果与美国农业部目前实施的基于SARIMA的预测结果进行比较。我们的发现表明，在预测范围内，MARRF和SARIMA模型提供了互补的优势。SARIMA在预测窗口末期的短期预测中表现尤为出色，而MARRF在中期预测中表现更佳。效率测试进一步显示，MARRF预测的误差系统模式较少，尤其是在较长预测期限内减少了SARIMA特有的规模相关效率问题。此外，包含预测的测试表明，每种模型都能捕捉到不同的信息，而简单地将两种预测结果平均化可以在整个预测周期内减少偏差并提高准确性。单一模型无法实现这些结果。准确性评估有助于建立模型可解释特征的可信度：变量重要性剖面显示了劳动力市场指标、工业产出和价格指数等因素在预测期限内的变化贡献。这些可解释的特征具有独立于预测准确性的价值，即使在MARRF表现不如SARIMA的预测期限内，也支持政策分析和预测叙述的制定。GTVP估计揭示了食品价格通胀驱动因素在极端时期（从2008年金融危机到COVID-19时期的家庭债务增加）的动态变化。这种更细致的理解对政策制定者至关重要，有助于更清楚地了解影响食品价格稳定的复杂机制。

本文的其余部分安排如下：第2节回顾了食品价格预测和机器学习在宏观经济中的应用相关文献；第3节描述了数据来源和因变量、自变量的构建；第4节详细介绍了MARRF方法和预测过程；第5节进行了预测性能评估，并对方法的时间变参数和变量重要性度量进行了经济解释；第6节总结了政策含义和未来研究的方向。

章节片段

文献综述

本文为经济预测和政策分析交叉领域的三个相互关联的研究方向做出了贡献。首先，它建立在食品价格通胀预测研究的基础上，这一领域在近期全球冲击和食品价格作为财政结果和社会稳定驱动因素的认识日益增强背景下重新获得了关注。其次，它借鉴了将机器学习方法应用于宏观经济预测的广泛且不断发展的文献。

所有食品消费者价格指数

本研究使用了美国劳工统计局（BLS）发布的所有食品CPI的月度数据。该指数跟踪了在家和外出消费的代表性食品篮子的价格，是美国食品价格通胀的主要衡量指标。

宏观经济自回归随机森林

我们实施了MARRF，这是一种将随机森林框架适应于动态、高维宏观经济数据的集成学习方法。MARRF旨在补充传统的自回归模型，结合了数据驱动的制度识别、状态依赖参数和高维宏观经济信息等功能。在Coulombe等人（2022）和Coulombe（2024）的基础上，我们的方法结合了递归划分和嵌入式局部自回归模型。

实证结果

我们评估了MARRF模型在2003年至2024年18个预测期限内的样本外预测性能。这一评估有两个目的：首先，确立该模型作为预测工具的可信度；其次，识别MARRF和SARIMA在不同方面的优势——这对于有效结合预测至关重要。我们没有使用简单的基准，而是将提出的MARRF模型与2003年至2024年期间的SARIMA模型的性能进行了比较。

结论与启示

美国农业部（USDA）的经济研究服务局发布的《食品价格展望》是预测年度食品价格通胀的主要联邦资源。我们的研究表明，当围绕经济逻辑和可解释性构建时，具有递归划分和时变参数的集成方法可以有意义地补充目前用于预测美国年度食品价格通胀的传统方法。

CRediT作者贡献声明

威廉·麦克威廉姆斯（William McWilliams）：撰写——审阅与编辑、初稿撰写、可视化、验证、软件开发、项目管理、方法论研究、数据分析、概念化。沙马尔·L·斯图尔特（Shamar L. Stewart）：撰写——审阅与编辑、初稿撰写、验证、监督、项目管理、数据分析、概念化。奥尔加·伊森吉尔迪娜·马萨（Olga Isengildina Massa）：撰写——审阅与编辑、初稿撰写、监督、项目管理

摘要

引言