
-
生物通官微
陪你抓住生命科技
跳动的脉搏
结合关系探索的视觉变换器在行人属性识别中的应用
《IEEE Transactions on Multimedia》:Vision Transformer With Relation Exploration for Pedestrian Attribute Recognition
【字体: 大 中 小 】 时间:2025年11月19日 来源:IEEE Transactions on Multimedia 9.7
编辑推荐:
行人属性识别通过探索图像区域与属性间关系实现高精度,但现有方法存在直接使用主干网络特征或单一结构(如Transformer)导致关系挖掘效率低和片面问题。本文提出ViT-RE框架,创新设计属性与上下文特征投影模块(ACFP)和关系探索模块(REM),结合图卷积网络(GCN)块与Transformer块同步挖掘属性、上下文及属性-上下文关联,并引入动态邻接模块(DAM)增强细粒度连接。实验表明,该模型在PETA、RAP、PA-100 K等数据集上表现优异,并获WACV 2023 UPAR挑战赛冠军。
行人属性识别(PAR)旨在检测监控场景中视频摄像机拍摄的行人图像的性别、年龄、服装、配饰等属性。随着对公共安全需求的增加以及智慧城市的发展,PAR方法变得越来越普遍[1]、[2]、[3]、[4]、[5]、[6]。然而,由于两个根本性问题,PAR仍然是一项具有挑战性的任务。一个问题源于多标签任务的固有复杂性;另一个问题与行人图像的特性有关,例如外观变化、照明多样性、分辨率低和部分遮挡。
生物通微信公众号
知名企业招聘