
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多域长尾图像识别中的重加权平衡表征学习:解决跨域类别不平衡的新方法
【字体: 大 中 小 】 时间:2025年07月06日 来源:Scientific Reports 3.8
编辑推荐:
本研究针对多域长尾(MDLT)图像识别中存在的域内类别不平衡和跨域样本比例差异问题,提出了一种创新的重加权平衡表征学习(BRL)算法。通过整合协变量平衡(CB)和表征平衡(RB)技术,该方法有效解决了输入特征空间和潜在表征空间的双重偏差问题。在六个基准数据集上的实验表明,BRL能够提取无偏的特征表征,显著提升分类器性能,尤其在难分类别上表现突出。该研究为环境监测、医学影像等领域的多域不平衡数据分类提供了可靠解决方案。
在计算机视觉领域,图像识别技术作为基础支撑着图像分割、目标检测等高级应用。然而长期存在的长尾分布(LT)问题——即少数类别占据大量样本而多数类别样本稀缺的现象,导致模型偏向主导类别,在罕见类别上表现欠佳。更复杂的是,现实场景中数据常来自多个异构源,产生域偏移(DS)现象——不同域间数据分布差异显著但语义结构相关。当长尾分布与域偏移同时出现时,便形成了多域长尾(MDLT)这一极具挑战性的问题。
苏州大学和马来西亚理科大学的研究团队在《Scientific Reports》发表的研究,针对MDLT问题提出了创新解决方案。现有方法如重采样、类别重加权等单独处理长尾分布或域偏移时效果有限,而结合两者的尝试常因梯度冲突或强假设条件难以实用。该研究通过整合协变量平衡(CB)和表征平衡(RB)技术,开发了重加权平衡表征学习(BRL)算法,在六个基准数据集上验证了其优越性。
研究采用的核心技术包括:1)基于多尺度高斯核的最大均值差异(MMD)度量域间表征距离;2)通过样本重加权实现协变量分布对齐;3)结合平衡交叉熵损失处理类别不平衡;4)设计跨域惩罚项减少域间差异。实验数据涵盖合成数字数据集Digits-MLT和真实场景数据集如VLCS-MLT、PACS-MLT等。
方法论-双重平衡表征学习
研究创新性地将观测研究中常用的协变量平衡技术引入MDLT问题。通过构建映射函数l(·)计算目标域样本权重wj,最小化源域与重加权目标域特征的L2距离。在表征空间,采用积分概率度量(IPM)对齐分布,使用多尺度高斯核增强度量敏感性。最终目标函数整合了分类损失、协变量平衡项、表征平衡项和域差异惩罚项,通过Adam优化器联合训练。
实验结果
在Digits-MLT数据集上,BRL的平均F1分数达0.672,显著优于域适应方法DANN(0.646)和长尾处理方法BoDA(0.601)。t-SNE可视化显示,BRL学习的特征在类别可分性和域不变性上均表现优异。在最具挑战性的TerraInc-MLT数据集上,BRL对零样本类别的识别准确率达43%,远超基线方法。参数分析表明,当α=10-3、β=10-2、γ=10时模型性能最优,且对α变化具有鲁棒性。
结论与展望
该研究提出的BRL算法通过双重平衡机制,有效解决了MDLT场景下的复合偏差问题,在多个基准上实现了最先进的性能。特别是在难分类别上的显著提升,展现了该方法在医疗影像分析(如罕见病诊断)和环境监测(如稀缺物种识别)等领域的应用潜力。未来研究可探索自适应参数优化策略,并扩展至开放集场景以增强实用性。
研究局限性包括对超参数的敏感性和封闭集假设,这些都为后续工作指明了改进方向。总体而言,这项工作为处理现实世界中复杂的多源不平衡数据提供了重要方法论创新,其技术框架也可推广至其他模态数据的跨域分析。
生物通微信公众号
知名企业招聘