
-
生物通官微
陪你抓住生命科技
跳动的脉搏
梯度放大:基于梯度匹配的数据集蒸馏新框架提升训练效率与性能
【字体: 大 中 小 】 时间:2025年07月06日 来源:Neural Networks 6.0
编辑推荐:
在本文中,研究人员针对大型数据集(Deng et al., 2009; Kirillov et al., 2023)带来的存储负担、训练耗时和隐私风险问题,开展了基于梯度匹配(GM)的数据集蒸馏(DD)研究。通过标签循环移位技术,生成更大、更多样化的梯度,结合提前退出机制和指数移动平均集成策略,显著提升蒸馏效率;同时引入分布匹配(DM)避免过拟合。实验在CIFAR10、CIFAR100等基准数据集上证明,该方法以更少迭代次数超越现有DD方法,为高效模型训练提供新路径。
为破解这一困局,来自中国国家自然科学基金支持的研究团队(基金号62272164和62306113)在论文《Gradient amplification for gradient matching based dataset distillation》中提出了创新方案,发表于《Neural Networks》。他们发现,梯度匹配的效能取决于梯度的规模与多样性——越大、越丰富的梯度,越能加速匹配并提升泛化性。于是,团队设计了一套融合标签移位、早期退出和集成策略的框架。实验证明,该方法在CIFAR10、CIFAR100、TinyImageNet和ImageNet子集上实现了突破:仅用更少训练迭代,就超越了多数现有DD方法,最高精度提升显著,同时训练效率提
生物通微信公众号
知名企业招聘