面向表格数据不平衡回归的校准混合增强方法
《Pattern Recognition》:Calibrated Mixup for Imbalanced Regression on Tabular Data
【字体:
大
中
小
】
时间:2025年10月16日
来源:Pattern Recognition 7.6
编辑推荐:
本文提出Calibrated Mixup框架,针对表格数据中目标变量分布倾斜问题,通过双重优化策略(全局统计校准MMD和局部结构保持SNN损失)生成高保真合成样本。实验表明该方法在7个表格数据集上MAE降低10-20%,特别适用于医疗预后(medical prognostics)和金融风险评估等关键领域。
关于不平衡分类的广泛研究提供了基础概念。技术大致分为数据级方法(重采样)、算法级修改(成本敏感学习)和混合方法。重采样方法,如开创性的合成少数类过采样技术(SMOTE)及其变体Borderline-SMOTE,通过插值生成合成少数类实例。虽然对...
我们提出校准混合(Calibrated Mixup),一个旨在缓解不平衡回归挑战的框架,特别是针对表格数据。该方法首先采用目标离散化和引导重采样作为准备阶段来构建问题。核心贡献在于后续阶段:使用定向混合策略为代表性不足区域生成高保真合成样本,然后进行新颖的双重优化过程,包括统计校准和软最近邻(Soft Nearest Neighbor, SNN)...
本节详细介绍了旨在验证所提出的Calibrated Mixup框架(包括其NC和FS变体)有效性的实验设置和结果。我们在多样化数据集上评估其与已建立基线的性能,并进行消融研究以评估其各组件的贡献及其鲁棒性。
本文介绍了Calibrated Mixup,一个解决不平衡回归的新颖框架——标准模型通常在偏态分布上表现不佳,对罕见但关键的值产生不可靠的预测——重点放在表格数据上,并展示了在图像任务上的有效性。我们的方法通过其核心创新为这些稀疏区域生成高保真合成数据:一种增强混合生成样本的双重优化策略。统计校准确保全局...
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号