
-
生物通官微
陪你抓住生命科技
跳动的脉搏
具有因果推断和跨模态对齐能力的无偏见实体化视觉表示学习
《ACM Transactions on Multimedia Computing, Communications, and Applications》:Unbiased Embodied Visual Representation Learning with Causal Inference and Cross-Modality Alignment
【字体: 大 中 小 】 时间:2025年11月08日 来源:ACM Transactions on Multimedia Computing, Communications, and Applications
编辑推荐:
目标导航中感知偏差问题影响策略泛化,本文提出基于因果推理和跨模态对齐的UEVR框架,通过Unbiased Causal R-CNN消除虚假关联偏差,利用几何约束编码三维先验到二维特征,构建模块化Causal-ObjectNav系统,实验表明其优于现有方法。
Causal-ObjectNav,该框架包括基于角点的场景探索模块和目标对象识别模块。在MP3D和HM3D数据集上的广泛实验表明,这种无偏导航模型优于现有的ObjectNav方法。