
-
生物通官微
陪你抓住生命科技
跳动的脉搏
自动驾驶决策新突破:混合课程强化学习与安全干预方法的创新融合
【字体: 大 中 小 】 时间:2025年10月11日 来源:TRANSPORTATION RESEARCH PART C-EMERGING TECHNOLOGIES 7.9
编辑推荐:
本文提出了一种混合课程学习(MCL)框架,结合了新颖的差异导向伯努利干预(DDBI)方法,以解决自动驾驶决策中强化学习(RL)面临的安全性和学习效率挑战。该方法通过分阶段训练(安全阶段与性能阶段)和概率化安全干预,在保持RL探索性的同时显著提升了训练过程的安全性,为复杂交互场景下的自动驾驶决策提供了高效可靠的解决方案。
生物通微信公众号
知名企业招聘