
-
生物通官微
陪你抓住生命科技
跳动的脉搏
自适应反馈延迟未知的在线凸优化算法研究
【字体: 大 中 小 】 时间:2025年08月09日 来源:Expert Systems with Applications 7.5
编辑推荐:
本文针对反馈延迟未知的在线凸优化(OCO)问题,提出自适应延迟镜像下降(ADMD)算法,通过虚拟迭代序列和基于累积未反馈次数的学习率η=O(1/√MT),实现了无需延迟先验知识的O(√MT)遗憾界,并创新性地引入延迟加倍技巧,在广告推荐和金融交易等场景展现优越性能。
研究亮点
• 提出自适应延迟镜像下降(ADMD)算法,通过虚拟迭代序列和基于累积未反馈次数mt的学习率η=O(1/√MT),突破传统算法需预知延迟的局限
• 首创延迟加倍技巧,通过动态调整学习率周期解决延迟环境下的时间窗同步难题
• 实验验证在点击率预测和股价波动场景中,ADMD较基线方法提升收敛速度达37%
方法创新
自适应延迟镜像下降(ADMD)
核心思想是构建虚拟决策序列{x?k},按实际反馈到达顺序更新:
x?k+1 = argminx∈X{ηk〈?fk(x?k),x〉 + Dψ(x,x?k)}
其中学习率ηk=1/√∑ki=1mi动态适应延迟情况,Bregman散度Dψ保证强凸性。
延迟加倍技巧
设计自适应时间窗机制:
初始化窗宽τ=20
当∑ts=t-τms > 2τ时触发窗宽倍增
重置ηt←1/√∑ts=1ms
该机制使算法在延迟突变时保持稳定性。
实验验证
在合成数据集和真实金融数据测试中:
• 延迟波动场景下ADMD遗憾界较传统OMD降低19-26%
• 窗宽自适应调整耗时仅增加8%但避免37%的性能震荡
结论
本研究为延迟敏感型决策系统(如实时医疗诊断和自动化交易)提供了理论保障,未来可拓展至随机延迟和非凸场景。
生物通微信公众号
知名企业招聘