
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于差异度量的端到端开集识别方法研究:任务特异性度量学习的创新应用
【字体: 大 中 小 】 时间:2025年07月19日 来源:Knowledge-Based Systems 7.2
编辑推荐:
针对开集识别(OSR)中未知类样本检测难题,研究人员提出融合差异表征与任务特异性度量学习的端到端框架,通过自适应学习差异函数,在CIFAR-10/SVHN等基准测试中显著提升已知类精度与未知类检测能力,为动态场景下的分类系统提供新范式。
在人工智能快速发展的今天,传统分类模型面临着一个根本性挑战:现实世界是动态开放的,而训练数据永远无法涵盖所有可能性。这种矛盾在医疗诊断、安防监控等关键领域尤为突出——系统不仅要准确识别已知疾病或物体,还必须能警觉地发现从未见过的类别。这就是开集识别(Open Set Recognition, OSR)研究的核心问题,其核心矛盾被理论化为"开放空间风险":当陌生样本落入已知类别的决策边界之外时,模型可能给出盲目自信的错误判断。
早期研究者们尝试了多种技术路线:用极值理论校准的OpenMax、生成对抗网络模拟未知空间、结合似然与距离的混合方法等。但令人惊讶的是,近年研究发现,经过精心调校的普通卷积网络(配合数据增强和余弦学习率调度)竟能与这些复杂方案匹敌。这一现象揭示了当前OSR技术的局限性,也催生了本文的创新探索。
巴西国家科学技术发展委员会(CNPq)和高等教育人才提升协调委员会(CAPES)资助的研究团队另辟蹊径,将差异表征(Dissimilarity Representation)与深度度量学习深度融合,提出端到端的差异度量框架。其核心突破在于:传统方法通常先学习嵌入再后处理,而该研究直接以原始差异值为决策依据,通过训练约束使单一阈值就能有效分割已知/未知区域。这种设计既保留了差异模型的数据类型无关性优势,又通过自适应学习克服了固定距离度量(如欧氏距离)的非线性表达能力局限。
研究采用两种主流表征学习技术——三元组损失(Triplet Loss)和对比损失(Contrastive Loss),构建了差异空间(TDS/CDS)与差异向量(TDV/CDV)四种变体。在标准OSR基准(CIFAR-10/SVHN)、类别扩展场景(DTD/FMD)和语义偏移基准(SSB)的三重验证中,对比差异变体(CDS/CDV)展现出全面优势。特别是在最具挑战性的Cars数据集设定下,其性能显著超越基于最大逻辑分数(MLS)的基线模型。
关键技术方法包括:1) 构建可学习的差异函数替代静态距离度量;2) 将原型样本差异向量作为分类依据;3) 通过三元组/对比损失约束嵌入空间几何结构;4) 在SSB等基准上系统评估开放空间风险控制能力。所有实验均采用留出部分类别作为未知类的严格评估协议。
研究结果方面:
• 标准OSR基准:在CIFAR-10上,CDV的AUROC达到0.912,比MLS基线提升7.3%;SVHN实验中F1分数提高9.2%。
• 类别扩展测试:当未知类比例增至50%时,TDV在DTD数据集上仍保持85.6%的闭集准确率。
• 语义偏移基准:在Aircraft数据集取得SOTA,但对细粒度鸟类识别的CUB数据集效果有限,揭示方法在细微差异判别上的改进空间。
结论部分强调,该研究首次实现了差异度量与深度学习的端到端协同优化,其创新性体现于:1) 差异函数直接参与梯度反传;2) 统一框架兼容多种损失函数;3) 原型机制支持动态类别扩展。讨论指出,未来可探索的方向包括:原型选择策略的自动化、多模态差异融合、以及面向医疗影像的跨域适应性研究。这项发表于《Knowledge-Based Systems》的工作,为处理现实世界中的不确定性分类任务提供了可扩展的新思路。
生物通微信公众号
知名企业招聘