面向表格数据不平衡回归的校准混合增强方法

《Pattern Recognition》:Calibrated Mixup for Imbalanced Regression on Tabular Data

【字体: 时间:2025年10月16日 来源:Pattern Recognition 7.6

编辑推荐:

  本文提出Calibrated Mixup框架,针对表格数据中目标变量分布倾斜问题,通过双重优化策略(全局统计校准MMD和局部结构保持SNN损失)生成高保真合成样本。实验表明该方法在7个表格数据集上MAE降低10-20%,特别适用于医疗预后(medical prognostics)和金融风险评估等关键领域。

  
学习从不平衡数据中
不平衡分类
关于不平衡分类的广泛研究提供了基础概念。技术大致分为数据级方法(重采样)、算法级修改(成本敏感学习)和混合方法。重采样方法,如开创性的合成少数类过采样技术(SMOTE)及其变体Borderline-SMOTE,通过插值生成合成少数类实例。虽然对...
提出的方法
我们提出校准混合(Calibrated Mixup),一个旨在缓解不平衡回归挑战的框架,特别是针对表格数据。该方法首先采用目标离散化和引导重采样作为准备阶段来构建问题。核心贡献在于后续阶段:使用定向混合策略为代表性不足区域生成高保真合成样本,然后进行新颖的双重优化过程,包括统计校准和软最近邻(Soft Nearest Neighbor, SNN)...
实验
本节详细介绍了旨在验证所提出的Calibrated Mixup框架(包括其NC和FS变体)有效性的实验设置和结果。我们在多样化数据集上评估其与已建立基线的性能,并进行消融研究以评估其各组件的贡献及其鲁棒性。
结论
本文介绍了Calibrated Mixup,一个解决不平衡回归的新颖框架——标准模型通常在偏态分布上表现不佳,对罕见但关键的值产生不可靠的预测——重点放在表格数据上,并展示了在图像任务上的有效性。我们的方法通过其核心创新为这些稀疏区域生成高保真合成数据:一种增强混合生成样本的双重优化策略。统计校准确保全局...
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号