
-
生物通官微
陪你抓住生命科技
跳动的脉搏
知识选择驱动的弱监督时序动作定位不确定性感知方法研究
【字体: 大 中 小 】 时间:2025年09月15日 来源:Displays 3.4
编辑推荐:
本文提出一种不确定性感知与知识选择(UAKS)框架,针对弱监督时序动作定位(WS-TAL)任务中因缺乏细粒度标注导致的预测不确定性和动作-背景混淆问题,创新性地融合证据学习(EDL)与概率分布学习(PDL)协同估计模型与数据不确定性,并设计外部知识选择机制,在THUMOS和ActivityNet v1.3数据集上分别实现12.9%与2%的精度提升,显著增强模型鲁棒性与可解释性。
Highlight
弱监督时序动作定位(WS-TAL)
WS-TAL是视频分析领域的研究热点,其目标在于仅使用视频级别标签(video-level labels)进行动作边界定位与类别识别。主流方法基于多示例学习(MIL)框架,将视频视为包含多个片段(实例)的包。若视频包含特定动作,则至少有一个片段属于该类别。这些方法通常先提取片段特征,再训练分类器以识别关键片段。
Proposed method
(此部分原文为空,暂不翻译)
Experiments
(此部分原文为空,暂不翻译)
Conclusion and limitation
本研究提出了一种名为UAKS的WS-TAL方法。针对因缺乏细粒度标注而导致的动作与背景混淆及预测不确定性高等挑战,该方法整合了两种不确定性估计策略:利用高效的证据学习(EDL)计算模型不确定性,从而约束模型以产生更置信的预测;并采用概率分布学习(PDL)从稀疏标注中推导数据不确定性。两种不确定性共同指导模型优化。此外,基于不确定性的知识选择机制使得外部知识在弱监督下得以高效利用。实验结果表明,我们的方法在准确性和鲁棒性上均有显著提升,揭示了不确定性建模在弱监督学习中的巨大潜力。
生物通微信公众号
知名企业招聘