
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于不变提示与分类器校正的持续学习新方法iPrompt-CR突破特征噪声与尺度偏差难题
【字体: 大 中 小 】 时间:2025年07月16日 来源:iLIVER CS1.5
编辑推荐:
针对持续学习(Prompt-based continual learning)中旧任务特征噪声和新旧任务分类器尺度偏差问题,研究人员提出iPrompt-CR方法,通过正交约束新任务键向量与旧任务查询原型实现不变提示,并采用高斯分布采样特征校正分类器,在四个基准数据集上显著提升类增量学习和通用增量学习性能。
在人工智能领域,持续学习(Continual Learning)如同人类终身学习的能力,是让模型在不断涌现的新任务中保持旧知识的关键技术。然而现有方法面临两大"记忆困境":当模型学习新任务时,旧任务的特征空间会被新提示组件污染成"噪声游乐场";不同任务分类器的输出尺度像错位的齿轮,导致决策边界严重偏倚。这些困境使得现有提示组件训练方法如CODA-Prompt在真实场景中举步维艰。
针对这些挑战,国内某研究机构(根据CRediT声明推测为国内单位)的Chunsing Lo、Hao Zhang和Andy J. Ma团队在《iLIVER》发表创新成果。他们开发的iPrompt-CR方法通过双重机制破解困境:首先用"数学隔离墙"——强制新任务键向量与旧任务查询原型正交,将特征噪声降低42%;再通过"尺度校准仪"——从高斯分布采样的多中心特征统一所有任务logit尺度,使分类准确率提升15.8%。这项突破为医疗影像多病种连续诊断、机器人跨场景自适应等需要持续进化AI的场景提供了新范式。
关键技术包括:1)基于ViT架构的提示组件训练;2)原型特征空间正交约束;3)多中心高斯分布采样;4)跨任务分类器联合优化。实验涵盖CIFAR-100等4个基准数据集,包含类增量(CIL)和通用增量(GIL)两种场景。
【不变提示学习】通过约束条件<>new,wold>=0的数学设计,使新任务组件对旧任务查询的权重衰减至1/10,特征相似度提升29%。
【分类器校正】从N(μt,Σt)分布采样5000个特征点,使各类别logit标准差从3.7降至0.8,边界混淆率降低62%。
【任务兼容性】在同时存在语义偏移和域偏移的GIL场景下,平均准确率达78.4%,超越CODA-Prompt 6.2个百分点。
该研究首次揭示提示组件训练中"训练-测试组件不一致"现象,提出的双阶段框架为持续学习提供新思路。特别是医疗领域,可使AI系统在逐步学习新疾病时保持对既往病种的诊断稳定性。未来可扩展至多模态持续学习场景,但当前对动态组件数量的适应性仍有提升空间。
生物通微信公众号
知名企业招聘