基于适配器解耦结构的半监督学习集成方法研究及其在分类与姿态估计中的应用

【字体: 时间:2025年07月22日 来源:Engineering Applications of Artificial Intelligence 7.5

编辑推荐:

  针对半监督学习(SSL)中集成学习成本与多样性难以平衡的问题,研究人员提出"基于适配器的解耦结构(DSA)",通过轻量级适配器将预测头映射至独立特征空间,在CIFAR-10/100分类任务中最高提升5.35%准确率,在Sniffing等姿态估计数据集上超越CBE方法2.08%-5.2%,为SSL工程化应用提供新范式。

  

在人工智能蓬勃发展的今天,半监督学习(SSL)因其能有效利用大量未标注数据而备受关注。然而,自训练过程中的伪标签噪声问题始终困扰着研究者,就像试图在暴风雨中辨别远方灯塔的微弱光芒——传统方法如FixMatch、FreeMatch等虽能提升模型性能,却难以避免错误标签的累积传播。更棘手的是,集成学习虽被证明能增强模型鲁棒性,但现有技术如通道集成方法(CBE)需要复杂的去相关损失函数,不仅存在超参数敏感、计算成本高的问题,还可能因过度解耦而损害模型性能。这种"既要马儿跑,又要马儿不吃草"的困境,严重制约了SSL在真实场景中的应用。

针对这一挑战,研究人员创新性地提出了"基于适配器的解耦结构(DSA)"。这项发表在《Engineering Applications of Artificial Intelligence》的研究,通过结构设计而非损失函数来实现预测多样性,犹如为集成模型装上了智能分频器——每个预测头配备独特的适配器,将共享特征映射到不同空间,既保持了参数效率,又避免了传统方法的计算负担。关键技术包括:1) 分类任务采用五层1×1卷积适配器增强语义特征解耦;2) 姿态估计使用空间几何约束适配器;3) 多头预测架构实现无额外损失函数的特征空间分离;4) 在CIFAR-10/100和Sniffing等数据集验证跨任务适用性。

学习带噪声标签部分揭示,DSA通过结构创新规避了标签校正方法的数据处理瓶颈,相比TCL等噪声处理方法更具效率优势。概述章节详细说明,DSA继承CBE框架但创新性地用适配器替代去相关损失,监督损失计算采用平均交叉熵(CE)策略,对标注数据利用更充分。

SSL姿态估计实验显示,在Sniffing(100数据30标签)、FLIC(100数据50标签)和LSP(200数据100标签)数据集上,DSA分别以2.08%、5.2%和2.35%的优势超越CBE,证明其在回归任务中的卓越表现。SSL分类实验中,CIFAR-10(40标签)和CIFAR-100(400标签)分别实现5.35%和0.71%的准确率提升,验证了方法在有限标注场景的有效性。

适配器结构设计讨论指出,DSA针对不同任务特性定制适配器:分类任务侧重深层语义解耦,姿态估计强调空间关系保持,这种"量体裁衣"的设计思想是其成功的关键。监督分类实验进一步证实,在CIFAR-10C和Animal-10N噪声数据集上,DSA展现出优于传统方法的稳定性。

该研究的突破性在于:首次通过纯结构设计实现集成学习的预测多样性,摆脱了对复杂损失函数的依赖。就像为SSL模型装上了"多焦点透镜",不同适配器从独特视角解析数据特征,既保留了集成学习的优势,又克服了传统方法的工程化障碍。未来可探索方向包括:适配器结构的自动化设计、在跨模态SSL中的应用等。这项由Jiaqi Wu等人完成的研究,不仅为SSL提供了新的技术工具,更开创了结构驱动式机器学习方法的新思路。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号