基于逻辑混合与解耦非对称损失的多标签图像分类数据增强方法LogicMix研究

【字体: 时间:2025年07月25日 来源:Pattern Recognition 7.5

编辑推荐:

  为解决多标签图像分类(MLC)中部分标注(PL)数据集导致的监督信号缺失问题,研究人员提出LogicMix样本混合增强方法,通过OR逻辑等价处理未知标签,结合DP-ASL损失函数差异化优化原始/增强样本的标签分布。该框架2WayAug-PL在MS-COCO等数据集实现84.3%的mAP突破,为MLC-PL任务提供通用解决方案。

  

在医学影像分析和食品成分识别等领域,多标签图像分类(MLC)技术至关重要。然而现实场景中,大规模数据集常因标注成本高昂而存在大量缺失标签,形成部分标注数据集(MLC-PL)。这种缺失导致监督信号锐减,传统样本混合增强方法如Mixup因无法处理未知标签(?)而失效,现有解决方案Mixup-PME虽通过替换常量缓解问题,却以牺牲监督信号为代价。如何在不引入噪声的前提下有效利用部分标注数据,成为制约MLC模型性能提升的关键瓶颈。

澳门理工大学(原文:Macao Polytechnic University)的研究团队在《Pattern Recognition》发表创新研究,提出LogicMix数据增强框架。该方法通过OR逻辑等价处理未知标签,配合Decoupled Partial-Asymmetric Loss(DP-ASL)差异化优化策略,构建出2WayAug-PL完整学习框架。关键技术包括:1) 基于逻辑OR的多样本标签混合算法;2) 针对原始/增强样本设计四参数独立调控的DP-ASL损失函数;3) 结合传统增强与伪标记的双路径数据扩充策略。实验覆盖MS-COCO等3个基准数据集衍生的27种场景。

【LogicMix设计】通过数学推导证明,当混合两个样本的标签向量y(1)和y(2)时,采用OR逻辑运算y'=y(1)∨y(2)可自然处理未知标签,避免传统算术混合导致的监督信号丢失。该方法支持任意数量样本混合,增强样本多样性。

【DP-ASL创新】分析发现增强样本存在正负标签分布失衡问题,传统ASL(Asymmetric Loss)难以适配。新损失函数设置γori+、γori-、γaug+、γaug-四组独立参数,分别调控原始样本正/负标签和增强样本正/负标签的损失权重。

【2WayAug-PL框架】整合LogicMix与传统数据增强形成双路径扩充:样本-样本关系维度通过LogicMix扩展,人类先验知识维度通过常规增强扩展。伪标记模块动态补充缺失标签,形成完整监督闭环。

在MS-COCO、VG-200和Pascal VOC 2007数据集上,2WayAug-PL分别取得84.3%、50.1%和93.8%的mAP,较现有最佳方法提升0.6%、0.6%和0.1%。Wilcoxon检验证实其优势具有统计显著性(p<0.05)。特别值得注意的是,LogicMix在9种对比场景中均显著优于Mixup-PME等替代方案,证明逻辑混合策略的有效性。

该研究突破性地解决了部分标注场景下的样本混合难题,其OR逻辑处理方法为多标签学习开辟新思路。DP-ASL首次实现不同类型样本的差异化优化,为不平衡学习提供普适性框架。实际应用中,该方法可显著降低医学影像等专业领域的标注成本,对推动多标签分类技术落地具有重要价值。开源代码已发布于GitHub平台,促进学术社区共同发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号