
-
生物通官微
陪你抓住生命科技
跳动的脉搏
SCESS-Net:基于语义一致性增强和片段选择的视听事件定位方法研究
【字体: 大 中 小 】 时间:2025年10月26日 来源:Computer Vision and Image Understanding 3.5
编辑推荐:
本文提出SCESS-Net网络,通过双向协同引导注意力(Bi-CGA)模块增强视听模态特征交互,采用多模态相似性学习(MSL)模型筛选高相似度片段,并设计全局语义感知增强(GSPE)模块利用视频级语义差异提升片段级表征。在AVE数据集上的实验表明,该网络能有效解决视听语义失配问题,显著提升事件定位性能。
生物通微信公众号
知名企业招聘