
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于卷积滤波器分组的梯度手术优化全景驾驶感知多任务模型
【字体: 大 中 小 】 时间:2025年06月29日 来源:Neurocomputing 5.5
编辑推荐:
为解决多任务学习中梯度冲突导致的负知识迁移问题,北京邮电大学团队提出基于卷积滤波器分组(PCFG)的梯度手术方法。该研究通过自适应梯度相似性分组策略优化PCGrad算法,在BDD100K数据集上验证了YOLOP等三种模型的性能提升,为自动驾驶多任务学习提供了通用梯度更新模块。
在自动驾驶技术快速发展的今天,全景驾驶感知系统需要同时处理目标检测、可行驶区域分割和车道线分割等多项视觉任务。传统独立处理方式不仅效率低下,更忽视了任务间的关联特征。尽管多任务学习(MTL)通过共享编码器提升了效率,但不同任务对共享参数的梯度优化方向常存在冲突,导致模型陷入次优解甚至出现负知识转移(negative knowledge transfer)现象。这种梯度冲突被定义为两个梯度向量夹角超过90°(余弦相似度为负),严重制约着多任务模型的性能提升。
北京邮电大学的研究团队在《Neurocomputing》发表的研究中,创新性地将梯度手术(PCGrad)与卷积滤波器特性相结合。研究发现,传统PCGrad将全模型参数展平处理会掩盖卷积神经网络(CNN)中不同滤波器对特征聚合的差异性——有些滤波器专注车辆轮廓特征,而其他可能捕捉车辆形状特征。受GradVac启发,团队证实对单个滤波器参数分别实施PCGrad会产生截然不同的优化方向。基于此,他们提出基于卷积滤波器分组(PCFG)的新型梯度手术方法,通过自适应梯度相似性分组策略,使共享编码器能更有效地学习任务间共性特征。
关键技术包括:1)基于BDD100K数据集的70K训练图像构建多任务基准;2)通过计算滤波器梯度与全任务梯度的余弦相似度实现自适应分组;3)在YOLOP、HybridNets和A-YOLOM三个开源模型中实现PCFG模块化集成。
【卷积滤波器分组方法】
提出梯度相似性度量指标,计算每个滤波器参数对各任务损失的梯度gki与全任务梯度gi的余弦相似度,将相似度阈值超过0.5的滤波器划归同组。实验显示该方法能使车辆检测相关滤波器自动聚集,分组后mAP提升2.3%。
【PCFG算法实现】
在反向传播阶段,对同组滤波器实施投影冲突梯度(PCGrad)操作:当检测任务梯度gdet与分割任务梯度gseg冲突时,将gdet投影至gseg的法平面。相比基线模型,YOLOP的检测精度和分割IoU分别提高1.8%和1.5%。
【多模型验证】
在BDD100K测试集上,PCFG使HybridNets的推理速度提升15%,A-YOLOM的误检率降低12%。消融实验证实,适度分组(每组含3-5个滤波器)能平衡计算开销与性能增益。
该研究首次系统探索了任务关系对共享编码器优化的影响,提出的PCFG模块具有三大创新:1)突破传统PCGrad的全局参数处理局限;2)通过滤波器分组实现细粒度梯度对齐;3)抽象出通用梯度更新范式。国家重点研发计划支持下的这项工作,为自动驾驶多任务学习提供了新的优化视角,其方法论可扩展至其他CNN基多任务场景。未来研究可探索分组粒度与任务复杂度的自适应匹配机制。
生物通微信公众号
知名企业招聘