模型预测任务采样：实现高效且稳健的适应性调整

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Nature Communications》：Model predictive task sampling for efficient and robust adaptation

【字体：大中小】 时间：2026年06月10日 来源：Nature Communications 15.7

编辑推荐：

　　摘要基础模型和通用策略依赖于适应性学习，包括元训练、领域随机化和监督式微调。在分布变化的情况下，具有挑战性的任务优先采样对于提高适应性鲁棒性至关重要。然而，对任务难度进行排序需要耗时的评估，无论是通过元强化学习中的智能体-环境交互和领域随机化，还是在大模型微

摘要

基础模型和通用策略依赖于适应性学习，包括元训练、领域随机化和监督式微调。在分布变化的情况下，具有挑战性的任务优先采样对于提高适应性鲁棒性至关重要。然而，对任务难度进行排序需要耗时的评估，无论是通过元强化学习中的智能体-环境交互和领域随机化，还是在大模型微调中的重复前向传播，这种方式都成本高昂。我们提出了模型预测任务采样（Model Predictive Task Sampling，简称MPTS）框架，该框架能够将任务空间与适应性风险分布联系起来，以实现主动的任务选择。MPTS利用轻量级的生成模型来预测特定任务的适应性风险，从而在降低评估成本的同时能够可靠地对任务难度进行排序。它可以无缝集成到零样本学习、小样本学习和监督式微调场景中。我们在模式识别和序列决策任务中进行了大量实验。实证结果表明，与现有方法相比，MPTS显著提高了模型对尾部风险或分布外任务的适应性鲁棒性，并且在学习效率上也优于CVaR_α等子集选择方法。

联系信箱：

粤ICP备09063491号

摘要

热点排行