基于脉冲驱动特征注意机制的多尺度Incepformer架构在低能耗高性能脉冲神经网络中的突破性研究

【字体: 时间:2025年06月20日 来源:Neurocomputing 5.5

编辑推荐:

  针对脉冲神经网络(SNNs)性能与能耗难以兼顾的瓶颈问题,武汉理工大学团队创新性地提出脉冲驱动Incepformer架构。通过设计多尺度特征注意力(SDFA)机制、引入脉冲Inception模块(SIM)和多样化分支卷积,在ImageNet-1k上实现80.41%的SOTA精度,为神经形态芯片的低能耗AI部署提供新范式。

  

在人工智能领域,脉冲神经网络(SNNs)因其类脑的事件驱动特性和超低能耗特性备受瞩目,被视为第三代神经网络。然而,这种模拟生物神经元脉冲发放机制的模型长期面临"性能鸿沟"困境——虽然能耗仅为传统人工神经网络(ANNs)的零头,但在复杂任务上的准确率往往相形见绌。特别是在计算机视觉领域,当处理ImageNet等大规模静态数据集时,现有脉冲Transformer架构要么依赖浮点运算牺牲能耗优势,要么保持纯脉冲驱动特性却导致性能大幅下降。这种"鱼与熊掌不可兼得"的现状,严重制约了SNNs在边缘计算和神经形态芯片上的应用前景。

武汉理工大学的研究团队在《Neurocomputing》发表的这项研究,开创性地将计算机视觉领域的Inception结构与脉冲Transformer相结合,提出名为Spike-Driven Incepformer(SDIncepformer)的新型架构。该研究通过三个关键技术创新:多尺度特征注意力机制(SDFA)实现跨尺度特征学习、脉冲Inception模块(SIM)增强特征多样性、多样化分支卷积缓解信息损失,最终在ImageNet-1k数据集上取得80.41%的top-1准确率,同时保持纯脉冲驱动的超低能耗特性。这一突破不仅刷新了脉冲驱动SNNs的性能记录,更为设计新一代神经形态芯片提供了理论支撑。

关键技术方法包括:1) 设计脉冲驱动特征注意力(SDFA)机制,通过特征矩阵运算替代传统自注意力;2) 开发三类脉冲Inception模块(SIM),分别应用于网络不同阶段;3) 采用渐进式下采样架构优化特征提取;4) 在CIFAR-10/100、ImageNet-1k等静态数据集和CIFAR10-DVS等神经形态数据集上进行对比验证;5) 基于膜电位短路(MS)机制确保纯脉冲驱动特性。

Spike-driven incepformer
研究团队构建的SDIncepformer采用分层设计:底层通过特征卷积提取多尺度特征,中层采用SDFA机制进行特征交互,高层集成SIM模块增强表征能力。与需要浮点运算的Spikformer相比,该架构全程保持0/1脉冲信号传递,通过膜电位短路避免多脉冲运算。实验显示,其计算复杂度较传统Transformer降低约47%。

Experiments
在ImageNet-1k测试中,SDIncepformer-L以80.41%准确率显著优于Meta-Spikeformer(77.67%)等对比模型,同时参数数量减少31%。在神经形态数据集CIFAR10-DVS上,其准确率达83.7%,验证了对动态视觉信息的处理优势。能量分析表明,该模型理论能耗仅为同类ANN架构的5%。

Limitation
研究者指出当前能耗评估仍停留在理论层面,未来需在神经形态硬件实测验证。此外,模型在视频理解等时序任务上的泛化能力有待进一步探索。

Conclusion
这项研究通过创新性地融合Inception结构与脉冲Transformer,成功突破了SNNs性能与能耗的权衡困境。其提出的SDFA机制和SIM模块为脉冲神经网络架构设计提供了新思路,特别是80.41%的ImageNet准确率标志着脉冲驱动网络首次达到实用化水平。该成果不仅推动了神经形态计算的发展,更为边缘智能设备实现"高智能-低能耗"的统一提供了可行路径。正如通讯作者Li Ma强调的:"这项工作为下一代神经形态芯片的算法-硬件协同设计奠定了重要基础。"

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号