
-
生物通官微
陪你抓住生命科技
跳动的脉搏
面向跨域少样本分类的特征变换与统计校准方法研究
【字体: 大 中 小 】 时间:2025年06月11日 来源:Engineering Applications of Artificial Intelligence 7.5
编辑推荐:
为解决遥感场景分类(RSSC)中目标域样本稀缺与源域-目标域分布差异的难题,研究人员提出抗过拟合与去偏的特征变换统计校准模型(FETAC)。该研究通过任务级特征调控(FiLM/RSA)与数据集级特征激活平衡(LLA)的协同优化,在五个跨域数据集上实现SOTA性能,尤其在1-shot场景表现突出,为少样本学习(FSL)向真实场景应用推进提供新范式。
在遥感技术迅猛发展的今天,海量标注数据的获取成本成为制约场景分类技术落地的关键瓶颈。少样本学习(FSL)虽能缓解数据依赖,但当源域(如卫星图像)与目标域(如无人机航拍)存在显著分布差异时,传统方法性能急剧下降。这种跨域少样本分类(CDFSC)的困境在灾害响应、农作物监测等现实场景中尤为突出——模型既要克服目标域极少量样本导致的过拟合,又要消除源域训练带来的特征偏置,犹如要求一个只见过沙漠照片的AI系统,突然能准确识别热带雨林的植被类型。
针对这一挑战,琶洲实验室等机构的研究团队在《Engineering Applications of Artificial Intelligence》发表研究,提出特征变换与统计校准(FETAC)框架。该工作创新性地将任务级与数据集级优化相结合:通过轻量级FiLM(特征线性调制)和RSA(残差适配)模块实现层间特征变换,仅微调少量参数即可抵抗过拟合;同时设计无参数的LLa(提升拉普拉斯激活)单元,通过非线性变换促使所有特征通道均衡参与适配,从统计层面消除源域偏置。这种双管齐下的策略,使模型在保持高效适配的同时实现无偏特征迁移。
关键技术包括:(1)构建FiLM-RSA串联网络实现层间特征调控;(2)设计基于Laplacian函数的激活平衡单元LLA;(3)采用NWPU45作为源域,在AID、PatternNet等五个渐进偏移的数据集验证;(4)1-shot/5-shot协议下的跨域评估。
研究结果
Cross-scene classification
通过分析遥感图像在传感器类型、拍摄高度等因素导致的域偏移特性,确立CDFSC比传统FSSC更具现实意义。
Preliminaries
形式化定义N-way K-shot任务范式,指出源域Db
与目标域Dn
的类别不重叠(Cb
∩Cn
=?)是核心挑战。
Datasets
选用分辨率、传感器类型逐步偏离NWPU45的五个目标域数据集,构建从0.3米(PatternNet)到2米(GID)的多尺度验证体系。
Discussion and limitations
相比多源域融合方法,FETAC仅需单源域训练即可实现优异迁移,但性能仍受骨干网络能力限制。
Conclusion
实验表明FETAC在1-shot任务平均提升8.7%,其插件式设计支持实时适配,为资源受限场景提供实用解决方案。
这项研究的突破性在于首次将特征激活的统计分布纳入跨域适配的优化目标。LLA单元通过数学构造强制特征通道的均衡贡献,犹如为AI系统安装"注意力分配调节器",避免模型仅依赖少数优势特征进行武断判断。该方法不仅为遥感领域带来新工具,其"微观特征校准+宏观任务适配"的双层优化思路,对医疗影像分析等小样本跨域任务同样具有启示意义。论文中透露的失败案例——直接整合TSA(抗过拟合)与STF(去偏)导致性能下降,恰恰印证了特征层面协同优化需要精细的数学设计,而非简单模块堆叠,这一发现为后续研究指明了技术深水区。
生物通微信公众号
知名企业招聘