
-
生物通官微
陪你抓住生命科技
跳动的脉搏
分数阶水下物联网恶意软件攻防博弈:基于模型与无模型的智能防御策略
【字体: 大 中 小 】 时间:2025年08月29日 来源:Engineering Applications of Artificial Intelligence 8
编辑推荐:
本文针对水下物联网(IoUT)面临的恶意软件威胁,创新性地构建了分数阶SIRL传播模型(含低能耗状态SIRL),结合微分博弈理论解析攻防动态交互的纳什均衡。提出基于模型(DNN/RNN集成学习)和无模型(多智能体强化学习)两类AI策略学习方法,解决了传统整数阶模型无法刻画水下环境记忆性、延迟性等核心特性的难题,为动态对抗环境下的自适应防御提供新范式。
Highlight
本研究首次将分数阶微积分与微分博弈相结合,构建了包含通信延迟、节点周期性休眠、AUV与UWRSN交叉感染等现实约束的SIRL(Susceptible-Infected-Recovered-Low energy)模型。通过哈密顿函数和变分原理,推导出分数阶系统下攻防双方的纳什均衡解,突破传统整数阶模型无法刻画水下环境记忆效应的局限。
Model-based methods for control
基于模型的机器学习(ML)与集成学习(EL)方法通过系统动力学生成状态-控制对,采用深度神经网络(DNN)、循环神经网络(RNN)等算法预训练防御策略。实验表明,LSTM-RNN混合模型对最优控制策略的逼近精度高达98.7%,显著优于单一算法。
Solving Nash equilibrium based on model-free methods
针对系统模型未知场景,提出非合作多智能体强化学习(RL)框架。攻击与防御智能体通过试错动态逼近纳什均衡,其中双延迟深度确定性策略梯度(TD3)算法在通信半径r=15m时收敛速度比传统Q学习快3.2倍,验证了分数阶博弈模型的有效性。
Numerical simulations
仿真实验揭示:1)分数阶α=0.85时,防御成本较整数阶降低18.6%;2)通信半径扩大至20m会使恶意软件感染峰值提前2.7小时;3)模型自由方法在30%参数扰动下仍保持92.4%的防御效能,展现强鲁棒性。
Nash equilibrium convergence analysis
• 理论层面:通过哈密顿函数获得的解析解具有数学严谨性
• 算法层面:TD3智能体在5000次迭代后收益波动小于0.5%,满足ε-纳什均衡条件
• 水下特异性:分数阶参数α与洋流速度呈负相关(R2=0.91),印证模型对实际环境的适配性
Future work
当前面临水下真实数据集匮乏、动态环境建模不完善等挑战。下一步将开发联邦学习框架解决数据隐私问题,并探索声学通信与光通信混合模式下的跨介质传播模型。
Conclusion
本研究通过分数阶SIRL模型与微分博弈的融合,为IoUT恶意软件防御提供理论闭环。提出的两类AI策略学习方法各具优势:基于模型方法适合已知动力学场景(误差<1.3%),无模型方法在复杂未知环境中展现更强适应性。
生物通微信公众号
知名企业招聘