
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于窗口补丁聚类自注意力的视觉Transformer高效识别方法
【字体: 大 中 小 】 时间:2025年10月12日 来源:Knowledge-Based Systems 7.6
编辑推荐:
本文提出了一种自适应窗口补丁聚类注意力机制(Winclu Transformer),通过多维空间相似性筛选关键图像块参与自注意力计算,显著降低了Vision Transformer(ViT)的计算复杂度。该方法无需预处理或额外训练即可适配多种视觉任务,实验表明在保持精度的同时有效提升了效率,并揭示了图像中仅部分关键补丁直接影响识别准确率,而其余补丁主要贡献预测置信度的新发现。
生物通微信公众号
知名企业招聘