利用贝叶斯优化的随机森林,通过博弈论框架下的SHAP(Shapley Value)方法对航空货运需求进行可解释性预测
《Frontiers in Physics》:Game-theoretic SHAP-driven interpretable forecasting of air cargo demand using Bayesian-optimized random forests
【字体:
大
中
小
】
时间:2025年10月22日
来源:Frontiers in Physics 2.1
编辑推荐:
空运货物需求预测框架创新:结合贝叶斯优化随机森林与SHAP解释,解决传统方法超参数调优效率低和模型黑箱问题,提升预测精度与可解释性,通过多源数据预处理和交叉验证验证模型性能,揭示水运、公路货运及民航客流量对需求的核心驱动作用。
在当今全球供应链日益复杂和动态变化的背景下,对航空货运需求进行准确的预测对于优化物流运营、合理安排航空货运能力以及降低运营成本具有重要意义。本研究提出了一种新的可解释预测框架,该框架结合了贝叶斯优化的随机森林(BO-RF)与基于博弈论的SHAP(SHapley Additive exPlanations)分析,旨在提升预测的准确性与模型的透明度。该框架在实际的月度航空货运数据基础上进行了实验验证,结果显示其在准确性和可解释性方面均优于传统机器学习基准模型。通过将贝叶斯优化的集成学习与基于SHAP的可解释性结合,本研究为运输领域的可解释、数据驱动预测文献提供了新的视角,并为航空货运行业的货运需求管理和运力规划提供了可操作的见解。
### 1. 引言
#### 1.1 背景与动机
航空货运需求的准确预测是优化航空物流战略规划、资源配置和运营效率的关键。然而,航空物流领域面临诸多挑战,这些挑战源于货运量的波动性和随机性,主要由贸易流量的变化、多模式运输中断以及政策的突然调整等复杂因素驱动。这种波动性对航空公司的运营、货运代理以及监管机构构成了风险,因为这些利益相关方需要可靠的预测来进行长期规划。此外,预测不仅支持战术层面的决策,如航班调度和货运空间分配,还对政策制定和基础设施投资具有重要指导意义,这些决策必须能够预判未来需求趋势并确保物流生态系统的可持续性。
#### 1.2 传统方法的局限性
传统的时间序列和计量经济模型,如自回归积分滑动平均(ARIMA)和指数平滑,长期以来是航空货运需求预测的基础。然而,这些模型在处理非线性动态系统时表现不佳,尤其是在受到宏观经济波动、替代运输模式(如海运或铁路货运)竞争以及显著的季节性波动影响时。这些局限性促使研究者逐渐转向机器学习(ML)方法,如随机森林(RF)、支持向量回归(SVR)和神经网络,因为它们具备更高的灵活性,能够捕捉复杂依赖关系并更有效地管理噪声和高维数据环境。尽管这些模型在预测性能上表现出色,但其实际应用仍面临挑战,尤其是在数据有限的情况下。
#### 1.3 本研究框架的创新点
为解决上述问题,本研究提出了两个互补的创新点。首先,将贝叶斯优化(BO)与随机森林相结合,以提供一种原理性且概率性的超参数搜索框架。通过使用代理模型和获取函数,BO能够智能地在参数空间中导航,从而在较少的评估次数下实现更高的预测准确性和稳健性。其次,引入SHAP值,这是一种基于博弈论的可解释性技术,能够通过Shapley值为模型输出提供理论基础,公平地归因于每个输入特征的边际贡献。这一方法不仅能够提供透明的、情境感知的预测解释,还支持模型逻辑与领域专业知识的验证。
本研究提出的BO-RF-SHAP框架在预测准确性和模型透明度方面具有显著优势,能够为航空货运行业的物流规划和运输政策提供决策支持。
#### 1.4 论文结构
本文的其余部分组织如下:
- 第2节回顾了航空货运预测、贝叶斯优化和可解释机器学习的相关研究。
- 第3节介绍了提出的BO-RF-SHAP框架及其理论基础。
- 第4节描述了数据集和变量设计。
- 第5节报告了实验结果和SHAP分析。
- 第6节总结了论文内容,并提出了未来研究的方向。
### 2. 文献综述
#### 2.1 航空货运量预测方法
早期对航空货运量的预测研究主要依赖于统计和时间序列技术,如指数平滑和季节性分解。这些模型因其透明性和易于实现而受到重视,但在捕捉由宏观经济波动、运营约束和外部冲击驱动的非线性依赖关系时表现有限。这一方法论上的局限性引发了对传统模型能否适应现代航空物流日益复杂动态的质疑。
随着航空领域大数据的兴起和机器学习技术的进步,预测方法开始向更复杂的方向发展。其中,随机森林(RF)因其集成结构、对过拟合的鲁棒性和处理高维、噪声数据环境的能力而成为广泛应用的工具。RF在多种运输研究领域得到了应用,包括乘客需求预测、货运流量估计和运输模式选择模型。同时,梯度提升方法,如XGBoost和LightGBM,在大规模或时间敏感的应用中也展现出强大的预测能力,因为它们能够在较短时间内完成模型训练并实现高精度。
然而,这些模型的预测性能高度依赖于精心调整的超参数,如树深度、集成大小和分割阈值。在许多实证研究中,这些值通常通过手动选择或网格搜索确定,这种策略不仅计算成本高昂,而且容易错过表现良好的参数空间区域。手动调整的模型可能会在小样本或不平衡数据集中出现过拟合短期噪声或欠拟合结构性需求模式的问题,这进一步引发了方法论上的关键问题:如何在数据环境中高效且自适应地选择超参数?
#### 2.2 贝叶斯优化用于超参数调优
贝叶斯优化(BO)提供了一种基于概率和样本效率的全局优化框架,特别适用于目标函数非凸、计算成本高且难以解析的场景。在航空货运量预测的背景下,目标是找到能够最小化预测误差指标(如均方根误差,RMSE)的超参数配置。传统的调优策略,如网格搜索或随机搜索,往往需要大量的评估次数,容易收敛到次优配置,特别是在特征空间高维且模型训练计算密集的情况下。BO通过引入代理模型(如高斯过程)来逼近目标函数,从而在较少的评估次数下识别出有潜力的超参数区域。
#### 2.3 SHAP和博弈论可解释性
近年来,机器学习模型在预测和决策支持中的广泛应用凸显了可解释性的重要性。尽管随机森林等集成方法在预测性能上表现出色,但它们通常被视为“黑箱”模型,缺乏对预测结果驱动因素的洞察。在航空物流等高风险领域,决策者需要不仅依赖可靠的预测,还需要透明的模型,以揭示预测背后的因果机制。传统的特征重要性度量(如基于Gini的指标)常常受到理论严谨性和无法捕捉特征交互效应的批评。因此,SHAP值成为一种强有力的方法,能够通过博弈论中的Shapley值为模型输出提供特征级贡献的解释。SHAP不仅确保了特征归因的一致性和局部准确性,还为复杂模型中的非线性模式、阈值效应和交互机制提供了清晰的洞察。
#### 2.4 可解释预测在运输决策中的应用
在运输领域,可解释模型对于提供可操作的见解、政策合规性和决策者信任至关重要。近年来,SHAP分析已被应用于多种运输场景,包括交通拥堵预测、共享出行模式分析和城市需求管理。在物流领域,SHAP被用来理解价格、经济指标和季节性对需求的敏感性,帮助从业者在实际操作中进行实时调整。然而,大多数研究将SHAP视为一种“事后”诊断工具,而不是将它嵌入预测架构或决策过程。此外,很少有研究利用SHAP构建博弈论模型,以模拟承运人和货主等利益相关者的行为。
#### 2.5 研究空白与本研究贡献
目前,关于将贝叶斯优化、随机森林建模和基于SHAP的可解释性整合到航空货运预测中的系统性研究仍较为有限。虽然每个组件在独立应用中都展现出一定的优势,但它们的结合应用仍较少,尤其是在航空物流领域,该领域存在非线性需求动态、战略决策和数据限制等问题。本研究通过以下方式填补这一空白:
- 提出一个BO-RF混合模型,通过高效的超参数调优提高预测性能;
- 嵌入SHAP解释,以揭示和量化航空货运需求的关键驱动因素。
这一整合方法为在不确定性环境下提供准确预测和可解释决策支持提供了新的解决方案,丰富了机器学习、博弈论和运输系统分析交叉领域的研究。
### 3. 方法论
#### 3.1 模型架构
本研究提出的框架采用了一种多层次的架构,旨在同时提升预测的准确性与可解释性。该框架由三个功能层组成:输入层、预测层和可解释性层,每个层在确保模型稳健性和实际适用性方面都发挥着互补作用。
- **输入层**:该层整合了来自国家统计局(NBS)的多源解释变量。为了确保数据质量和一致性,分类字段被转换为数值表示,缺失值通过中位数填补。通过设定皮尔逊相关系数阈值(|r| > 0.9),剔除高度冗余的变量,保留一个低冗余但信息丰富的特征子集。
- **预测层**:该层构成了框架的预测核心。在五折交叉验证设置下,随机森林(RF)、支持向量回归(SVR)、XGBoost和GBDT的泛化性能被系统比较,以确定最适合的基准模型。RF在准确性和鲁棒性方面表现最佳,因此被选为预测引擎。为了进一步提升其性能,贝叶斯优化(BO)被用于自动调优超参数,从而在较少的迭代中找到最优配置。
- **可解释性层**:该层通过博弈论中的Shapley值为模型输出提供透明的特征归因。在模型训练后,BO-RF模型与SHAP结合,以揭示预测结果背后的因果机制。SHAP不仅提供了个体预测的局部解释,还揭示了整体预测中的模式,通过SHAP交互和依赖图进一步明确非线性阈值和交叉弹性。
通过这种三层次设计,本研究提出的系统不仅能够生成准确且稳健的预测,还能提供理论依据的、决策相关的解释,从而增强利益相关者的信心并支持航空物流领域的战略决策。
#### 3.2 随机森林:一种非线性方法
随机森林(RF)是一种集成学习算法,通过构建多个决策树并聚合它们的输出来实现稳健预测。每个树都基于数据集的引导样本进行训练,而随机特征选择则进一步增加了多样性,降低了过拟合的风险。这种双随机化策略使RF能够建模解释变量与目标变量之间的复杂、非线性依赖关系。与传统的线性模型不同,RF能够捕捉到复杂的、非线性的交互效应,因为其基于树的结构可以递归地根据不同的特征组合分割数据。
在回归任务中,最终预测结果是所有单棵树输出的平均值,这有助于稳定预测并减少单棵树的方差。RF在处理高维数据和异构预测变量方面表现出色,这使其特别适用于预测任务,其中多个变量以复杂方式相互作用。此外,RF提供了自然的特征重要性分析框架,这一框架在本研究中通过基于博弈论的SHAP值得到进一步增强。SHAP值能够解释非线性背景下的特征贡献,从而提高模型的透明度,并为航空物流领域的决策提供有价值的信息。
#### 3.3 贝叶斯优化用于超参数调优
贝叶斯优化(BO)提供了一种基于概率和样本效率的全局优化框架,特别适用于目标函数非凸、计算成本高且难以解析的场景。在航空货运量预测的背景下,目标是找到能够最小化预测误差指标(如均方根误差,RMSE)的超参数配置。传统的调优策略,如网格搜索或随机搜索,往往需要大量的评估次数,容易收敛到次优配置,特别是在特征空间高维且模型训练计算密集的情况下。BO通过引入代理模型(如高斯过程)来逼近目标函数,从而在较少的评估次数下识别出有潜力的超参数区域。
#### 3.4 SHAP可解释性:博弈论视角
本研究框架的可解释性基于Shapley值,这是一种源于合作博弈论的概念。对于给定的特征i,其Shapley值表达式为:
$$
\phi_i = \sum_{S \subseteq N \setminus \{i\}} \frac{|S|! (n - |S| - 1)!}{n!} [f(S \cup \{i\}) - f(S)]
$$
其中,N表示所有特征的集合,S是不包含特征i的任意子集,f(?)表示模型的预测函数。这一表达式量化了特征i在子集S中添加后的边际贡献,而组合系数确保了贡献在所有可能的特征排列中被公平平均。这种公式化方法与合作博弈中的收益分配原则相似,其中每个玩家的收益由其在所有联盟中的平均贡献决定。在机器学习背景下,特征作为玩家,模型预测作为集体收益,因此Shapley值能够将预测结果公平地分配给各个特征。
在航空货运需求预测的背景下,这种解释方法不仅揭示了哪些变量(如水路货运、公路货运或乘客流量)驱动模型预测,还量化了它们在博弈论意义上的相对重要性。因此,Shapley值为预测准确性和可解释性之间的桥梁,确保模型输出能够以透明的方式为政策和运营决策提供信息。
#### 3.5 评估指标
为了全面评估模型的预测性能,本研究使用了多种评估指标,包括决定系数(R2)、平均绝对误差(MAE)和均方根误差(RMSE)。R2值衡量了目标变量的方差可由独立变量解释的比例,R2值越高,模型的解释能力越强。RMSE衡量了预测值与观测值之间的平方根差值,对较大的偏差赋予更高权重,从而突出预测的稳健性。MAE则提供了预测误差的平均幅度,不考虑误差的方向,从而提供了一个直观的预测准确度衡量。一般来说,MAE和RMSE值越低,R2值越高,模型的预测性能越优越。
### 4. 数据描述
#### 4.1 数据来源
本研究使用了中国航空货运统计数据,数据涵盖了从2006年3月到2025年4月的202个月份。该数据集包括主要国内和国际航线的货运吞吐量,以10?吨为单位。为了捕捉航空货运需求的多因素驱动,本研究还从国家统计局和中国海关总署等权威来源收集了额外的解释变量。最终整理的数据集包括202个观测值,其中1个目标变量(航空货运量)和16个预测变量,这些变量在相同的时间频率下进行分析。
#### 4.2 数据预处理
在模型训练之前,数据预处理阶段旨在确保数据质量和统计有效性。为了减少多重共线性对模型稳定性和预测准确性的影响,本研究首先计算了所有候选解释变量的皮尔逊相关系数矩阵。相关系数矩阵如图2所示,提供了运输和宏观经济指标之间线性关系的直观可视化。为了避免信息重叠导致的冗余,研究者系统地检查了矩阵的上三角部分。当两个变量之间的相关系数绝对值超过阈值0.9时,只保留与目标变量(航空货运量)关联更强的变量。这一阈值选择与实证计量经济学和机器学习中的常规做法一致,以避免因共线性而引起的参数估计不稳定和预测模型方差膨胀。
通过这一过滤过程,去除了高度同质化的指标。例如,公路货运量和公路货运周转量的相关系数约为0.98;水路货运量和水路货运周转量的相关系数约为0.98;总进出口量与进出口量分开的相关系数超过0.98;公路客运量与总客运量的相关系数约为0.99。这些指标之间的高度相关性表明它们可能在预测中具有相似的作用,因此被剔除。
最终保留的特征既包括结构性指标,如关键货运量,也包括时间变量,如月份,以捕捉季节性变化。如图3所示,这一精简的特征集合不仅减少了预测变量之间的强线性依赖,还增强了数据中因果关系的可解释性。最终,这一步骤提高了后续建模框架的泛化能力,确保预测变量提供互补的、非冗余的信息。
### 5. 实验与结果
#### 5.1 模型预测比较
为了严格评估不同机器学习模型的预测性能,本研究在四个代表性算法(随机森林(RF)、支持向量回归(SVR)、极端梯度提升(XGBoost)和梯度提升决策树(GBDT))上进行了五折交叉验证(n splits = 5,shuffle = True,random state = 42)。这些模型因其互补的方法论特性而被选择。RF在处理噪声和高维数据方面表现出色,能够捕捉复杂的非线性关系和高阶交互;SVR作为经典的核方法基准,在小到中等规模的数据集中展现出强大的泛化能力;XGBoost引入了高级的正则化和稀疏感知机制,提高了效率和预测精度;GBDT代表了传统的梯度提升框架,广泛应用于回归任务。
实验结果显示,RF在预测性能上显著优于SVR、XGBoost和GBDT。如图4所示,RF的MAE为3.54,而SVR为5.22,XGBoost为4.17,GBDT为4.01,表明RF的预测值更接近实际值。同样,图4b显示RF的RMSE为4.62,优于SVR(6.94)、XGBoost(5.40)和GBDT(5.03),进一步验证了其优越的预测准确性。图4c的R2值为0.8797,优于SVR(0.7269)、XGBoost(0.8351)和GBDT(0.8573),表明RF在解释数据方差方面具有更高的能力。
#### 5.2 随机森林的贝叶斯优化
基于RF的优越基准性能,本研究进一步利用贝叶斯优化(BO)来增强其预测能力。优化过程探索了一个定义明确的超参数搜索空间,包括树的数量(10-300)、最大树深度(3-15)、节点分割所需的最小样本数(2-10)以及叶节点所需的最小样本数(1-10)。优化目标被设定为负的均方根误差(–RMSE),并采用五折交叉验证(n splits = 5,shuffle = True,random state = 42)以确保预测性能的稳健评估。
在确定最优超参数后,预测性能被评估。预测结果如图5所示,其中X轴和Y轴分别表示实际和预测的航空货运量(10?吨)。黑线代表完美的预测。优化后的RF模型在预测准确性方面取得了显著提升,交叉验证结果显示其R2值约为0.905,RMSE为4.130,MAE为3.178。预测点大多集中在理想拟合线上,误差水平集中在较低范围。这种紧凑的分布不仅表明了模型拟合的改进,还体现了其在不同样本范围内的稳健性。这种稳定性在航空货运预测中尤为重要,因为需求波动和非线性关系常常挑战传统的预测方法。
#### 5.3 SHAP特征重要性分析
为了进一步探讨预测变量之间的非线性效应和阈值行为,本研究构建了SHAP依赖图。如图7所示,公路货运量和水路货运量表现出强烈的正向贡献,而公路客运量则呈现出更分散和对称的SHAP值分布,表明可能存在非线性或阈值效应。月份显示了明显的季节性模式,SHAP曲线在8月之后变为正向,捕捉了高需求高峰期显著提高航空货运预测值的现象,而较早的月份则主要起到抑制作用。
水路客运量表现出单调的负向贡献,其SHAP值在5.5-6时穿越零阈值,表明在水路客运量较高时,替代效应开始显现,从而抑制了航空货运需求。这些发现揭示了航空货运需求中复杂的交互机制,为预测模型的设计提供了重要的启示。
### 6. 结论与政策启示
#### 6.1 结论
本研究通过提出一种结合贝叶斯优化(BO)、随机森林(RF)和基于博弈论的SHAP特征归因的可解释混合框架,推动了航空货运预测领域的研究进展。该框架基于中国航空货运统计数据与宏观经济指标和多模式运输变量的综合数据集,揭示了多个关键发现。
实验结果表明,BO-RF框架在预测性能上优于SVM、XGBoost和GBDT等基准模型。在RMSE、MAE和R2等指标上,该框架均表现出显著优势,验证了BO在增强基于机器学习的预测模型鲁棒性和准确性方面的价值。此外,SHAP的引入提供了高度的可解释性,揭示了水路货运、公路货运和民用航空客运量作为航空货运需求的主要预测因子。这些见解不仅揭示了需求动态,还为协调运输基础设施投资和规划提供了实践基础。总体而言,该框架在预测准确性和可解释性方面都具有显著优势,能够为航空物流领域的短期运营决策和长期战略政策发展提供有力支持。
#### 6.2 政策启示
本研究提出的BO-RF-SHAP框架具有重要的政策启示。首先,它能够增强多模式运输之间的协调与运力匹配。SHAP结果表明,公路和水路货运对航空货运需求具有显著影响,这提示政策制定者应加强多模式运输链接(如港口-机场-公路走廊),以提高转运效率并稳定航空货运吞吐量。
其次,该框架可以嵌入到物流治理中,为监管机构和物流企业提供可解释的模型支持,以指导航班时刻分配、价格调整和合规性监控。SHAP值的透明性确保了预测的准确性与可信度,支持基于证据的政策实施。
最后,该框架为在不确定性下进行长期政策制定提供了指导。通过量化宏观经济和运输变量的影响,该框架使政策制定者和行业领导者能够进行更具弹性的规划。它支持战略举措,如运力扩展、碳减排政策和贸易韧性战略,确保航空物流能够有效适应结构性变化和短期冲击。
#### 6.3 未来研究方向
尽管本研究提出的框架在方法论创新和实际应用方面都具有重要意义,但其应用范围仍有进一步拓展的潜力。一个可能的研究方向是将实时数据源(如实时航运记录、公路交通流量和海关清关过程)整合到预测模型中,以提高短期响应能力和预测准确性。另一个值得探索的方向是引入深度学习技术,将BO调优的随机森林与时间序列模型(如LSTM或Transformer)结合,以捕捉复杂的顺序依赖关系。此外,博弈论模拟也是一个富有前景的研究方向,因为SHAP导出的特征贡献可以作为输入,用于模拟物流利益相关者之间的竞争和合作行为,从而进一步揭示市场动态和政策干预的复杂性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号