
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于概率方法与不确定性量化的飞行过程预测模型研究——以航班区块时间预测为例
【字体: 大 中 小 】 时间:2025年08月10日 来源:Expert Systems with Applications 7.5
编辑推荐:
研究人员针对航空运输领域机器学习预测模型难以量化个体预测不确定性的问题,开发了一种结合回归模型与概率分类器的双模型方法。该研究通过预测航班区块时间(block time)的案例验证,实现了对预测误差分布的动态表征,其模型在准确度(accuracy)、不确定性(uncertainty)和预测区间覆盖概率(PICP)三项指标上均优于传统高斯分布假设、分位数回归和自助法,为航空运营决策支持系统提供了更可靠的量化工具。
航空运输领域长期面临航班延误传播的非线性难题——乘客错过中转、机场宵禁罚款等突发事件会导致成本呈指数级增长。然而,现有机器学习模型仅能提供整体性能指标,无法量化单次预测的置信度,这种"平均值的谬误"严重制约了航空决策系统的可靠性。针对这一痛点,英国威斯敏斯特大学建筑与城市学院(University of Westminster, School of Architecture and Cities)空中交通管理研究中心的Paolino De Falco和Luis Delgado团队创新性地提出"回归-分类"双模型框架,相关成果发表于《Expert Systems with Applications》。
研究采用三项关键技术:1)通过回归模型(XGBoost/神经网络)初步预测目标变量;2)将回归误差离散化为分类标签,采用带交叉熵损失的分类器构建概率分布;3)结合VIKOR多准则决策方法优化模型参数选择。数据源自欧洲航空安全组织(EUROCONTROL)的DDR2航班数据库,整合气象(ERA5/METAR)、飞机性能(BADA)等多源特征。
模型架构设计
研究将连续变量预测转化为分类问题:回归模型输出初始预测值后,分类器对其误差进行概率分布建模。例如预测120分钟航班时间时,分类器可能输出[-5,0)分钟误差区间概率20%、[0,5)分钟45%等,最终叠加形成完整概率分布。这种设计突破传统方法仅能提供点估计或固定区间的局限。
性能验证
在航班区块时间预测中,仅使用大圆距离(GCD)特征的回归模型(gcd-10-bins)表现最优,平均绝对误差5.5分钟,不确定性22分钟,PICP达94.1%。相比传统方法,该框架在保持95%覆盖概率时,将不确定性区间压缩40%(较分位数回归神经网络QRNN的40.36分钟降至22分钟),且能自适应调整单次预测的置信区间。
决策支持价值
研究揭示航空延误成本函数存在显著非线性特征:cost(delay)≥cost(delay)。通过概率分布捕捉长尾风险,可使航空公司更精准评估加速飞行挽回延误的燃油成本权衡。该方法已成功应用于Clean Sky 2项目的航班调度系统,显著提升异常事件响应能力。
这项研究为交通指标预测树立了新范式,其核心价值在于:1)首次实现单次预测不确定性的动态量化;2)通过VIKOR方法解决模型参数多目标优化难题;3)验证简单回归器(如仅用WTC特征)配合高级分类器仍可获优异性能,为资源受限场景提供解决方案。未来可扩展至医疗预后、金融风险评估等需概率化决策的领域。
生物通微信公众号
知名企业招聘