自适应反馈延迟未知的在线凸优化算法研究

【字体: 时间:2025年08月09日 来源:Expert Systems with Applications 7.5

编辑推荐:

  本文针对反馈延迟未知的在线凸优化(OCO)问题,提出自适应延迟镜像下降(ADMD)算法,通过虚拟迭代序列和基于累积未反馈次数的学习率η=O(1/√MT),实现了无需延迟先验知识的O(√MT)遗憾界,并创新性地引入延迟加倍技巧,在广告推荐和金融交易等场景展现优越性能。

  

研究亮点

• 提出自适应延迟镜像下降(ADMD)算法,通过虚拟迭代序列和基于累积未反馈次数mt的学习率η=O(1/√MT),突破传统算法需预知延迟的局限

• 首创延迟加倍技巧,通过动态调整学习率周期解决延迟环境下的时间窗同步难题

• 实验验证在点击率预测和股价波动场景中,ADMD较基线方法提升收敛速度达37%

方法创新

自适应延迟镜像下降(ADMD)

核心思想是构建虚拟决策序列{x?k},按实际反馈到达顺序更新:

x?k+1 = argminx∈Xk〈?fk(x?k),x〉 + Dψ(x,x?k)}

其中学习率ηk=1/√∑ki=1mi动态适应延迟情况,Bregman散度Dψ保证强凸性。

延迟加倍技巧

设计自适应时间窗机制:

  1. 初始化窗宽τ=20

  2. 当∑ts=t-τms > 2τ时触发窗宽倍增

  3. 重置ηt←1/√∑ts=1ms

    该机制使算法在延迟突变时保持稳定性。

实验验证

在合成数据集和真实金融数据测试中:

• 延迟波动场景下ADMD遗憾界较传统OMD降低19-26%

• 窗宽自适应调整耗时仅增加8%但避免37%的性能震荡

结论

本研究为延迟敏感型决策系统(如实时医疗诊断和自动化交易)提供了理论保障,未来可拓展至随机延迟和非凸场景。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号