
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于树模型与近似动态规划的军事医疗后送调度优化研究:解决DPR-D问题的智能决策新范式
【字体: 大 中 小 】 时间:2025年06月17日 来源:Expert Systems with Applications 7.5
编辑推荐:
【编辑推荐】针对军事医疗后送(MEDEVAC)中调度(Dispatch)、抢占式改道(Preemptive Rerouting)、再部署(Redeploy)与伤员转运(Delivery)的复杂决策问题(DPR-D),研究团队构建了无限视界马尔可夫决策过程(MDP)模型,创新性融合随机森林(API-RF)与极限梯度提升(API-XGB)的近似动态规划(ADP)算法。结果表明,两种算法在36个战场场景中均显著超越现行"最近单位优先"策略,其中API-XGB在32个场景中表现更优。研究通过可解释AI技术揭示了伤员队列长度、MTF床位容量等关键特征对决策的影响,为战伤救治体系优化提供了智能决策支持。
在现代化军事冲突中,战伤救治的时效性直接关系到士兵的生存率。2009年美国国防部提出的"黄金一小时"(Golden Hour)原则要求重伤员必须在60分钟内获得救治,但传统医疗后送(MEDEVAC)系统依赖简单的"最近单位优先"策略,忽视了医疗救治机构(Medical Treatment Facility, MTF)的能力差异、床位容量限制以及动态战场环境等关键因素。现有研究多聚焦单一调度决策,对伤员转运目的地(Delivery)的优化研究严重不足,导致系统长期性能受限。
针对这一挑战,美国空军资助的研究团队在《Expert Systems with Applications》发表创新成果,首次将调度(Dispatch)、抢占式改道(Preemptive Rerouting)、再部署(Redeploy)与伤员转运(Delivery)整合为DPR-D问题框架。研究构建了基于无限视界折扣奖励的连续状态MDP模型,采用改进型近似策略迭代(API)算法,创新性地将随机森林(RF)和XGBoost两种树模型融入值函数近似(VFA)过程。通过波斯尼亚-黑塞哥维那高烈度作战想定验证,算法在伤员存活率指标上实现突破性提升。
关键技术方法包括:1) 构建包含MTF能力分级(Role II/III)和床位约束的MDP状态空间;2) 采用轨迹采样替代随机采样解决连续状态难题;3) 开发基于战场知识的基函数增强模型可解释性;4) 在API框架中集成API-RF和API-XGB两种树算法,每次策略改进阶段重建完整估值模型。
【问题建模】
研究将MTF按救治能力分为Role II(基础创伤处理)和Role III(全科手术),结合伤员三级分类(常规/优先/紧急),构建了包含14维状态向量的MDP模型。状态特征涵盖各MTF床位占用率、伤员队列长度、单位位置等动态信息,行动空间涉及单位调度、路径调整及MTF选择等复合决策。
【算法创新】
区别于传统离散状态API-RF,研究针对连续状态空间改进三点:1) 采用蒙特卡洛轨迹采样获取代表性状态;2) 在策略评估阶段用完整树模型替代增量更新;3) 引入MTF服务半径等军事领域知识构建基函数。API-XGB通过二阶导数优化和正则化项,在21/32案例中显著优于API-RF(p<0.05)。
【战场验证】
在模拟的36个作战场景中,当伤员到达强度>5人/小时时,算法优先考虑MTF床位可用性;低强度时则侧重缩短地理距离。API-XGB在伤员存活率指标上平均提升19.7%,尤其对Role III MTF容量敏感(特征重要性达0.38),证实高级别救治资源是系统瓶颈。
结论部分强调,这是首个同时解决MEDEVAC单位动态调度与伤员精准转运的决策框架。树模型的可解释性揭示了不同作战强度下决策权重的动态变化:高负荷时系统自动切换为"床位优先"策略,低负荷时回归地理邻近原则。研究为战伤智能救治系统开发提供了新范式,其API-XGB架构对其它应急响应场景具有普适参考价值。未来工作将拓展至多战区协同救援和无人机医疗后送等新型场景。
生物通微信公众号
知名企业招聘