侯悦; 项水英; 邹涛; 黄志权; 石尚轩; 郭星星; 张雅慧; 郑凌; 郝跃

doi:10.7498/aps.74.20250390

摘要
随着脉冲神经网络(Spiking Neural Network,SNN)在硬件部署优化方面的发展，基于现场可编程门阵列(Field-Programmable Gate Array,FPGA)的SNN处理器因其高效性与灵活性成为研究热点。然而，现有方法依赖多时间步训练和可重配置计算架构，增加了计算与存储压力，降低了部署效率。本文设计并实现了一种高能效、轻量化的残差SNN硬件加速器，采用算法与硬件协同设计策略，以优化SNN推理过程中的能效表现。在算法上，采用单时间步训练方法，并引入分组卷积和批归一化(Batch Normalization,BN)层融合技术，有效压缩网络规模至0.69M。此外，采用量化感知训练(Quantization-Aware Training,QAT)，将网络参数精度限制为8 bit。在硬件设计上，本文通过层内资源复用提高FPGA资源利用率，采用全流水层间架构提升计算吞吐率，并利用块随机存取存储器(Block Random Access Memory,BRAM)存储网络参数和计算结果，以提高存储效率。实验表明，该处理器在CIFAR-10数据集上分类准确率达到87.11%，单张图片推理时间为3.98 ms，能效为183.5 FPS/W，较主流图形处理单元(Graphics Processing Unit,GPU)平台能效提升至2倍以上，与其它SNN处理器相比，推理速度至少提升了4倍，能效至少提升了5倍。

关键词:
脉冲神经网络 /

现场可编程门阵列 /

高能效 /

轻量化
Abstract
With the advancements in hardware-optimized deployment of Spiking Neural Networks (SNNs), SNN processors based on Field-Programmable Gate Arrays (FPGAs) have become a research hotspot due to their efficiency and flexibility. However, existing methods rely on multi-timestep training and reconfigurable computing architectures, which increase computational and memory overhead, reducing deployment efficiency. This work presents a high-efficiency, lightweight residual SNN accelerator that couples algorithmic and hardware co-design to optimize inference energy efficiency. On the algorithm side, we employ single-timesteps training, integrate grouped convolutions, and fuse Batch Normalization (BN) layers, compressing the network to only 0.69 M parameters. Quantization-aware training (QAT) further constrains all weights and activations to 8-bit precision. On the hardware side, intra-layer resource reuse maximizes FPGA utilization, a fully pipelined cross-layer architecture boosts throughput, and on-chip Block RAM (BRAM) stores both network parameters and intermediate results to improve memory efficiency. Experimental results demonstrate that the proposed processor achieves an 87.11% classification accuracy on the CIFAR-10 dataset, with an inference time of 3.98 ms per image and an energy efficiency of 183.5 FPS/W. Compared to mainstream Graphics Processing Unit (GPU) platforms, it achieves over twice the energy efficiency. Furthermore, compared to other SNN processors, it achieves at least a 4×improvement in inference speed and a 5×improvement in energy efficiency.

Keywords:
Spiking Neural Networks /

Field-Programmable Gate Array /

High Efficiency /

Lightweight
施引文献

[1]
[2]
[3]
[4]
[5]
[6]
[7]
[8]
[9]
[10]
[11]
[12]
[13]
[14]
[15]
[16]
[17]
[18]
[19]
[20]
[21]
[22]
[23]
[24]
[25]
[26]
[27]
[28]
[29]
[30]
[31]
[32]
[33]
[34]
[35]
[36]

[1]	王永博, 唐曦, 赵乐涵, 张鑫, 邓进, 吴正茂, 杨俊波, 周恒, 吴加贵, 夏光琼. 基于Si₃N₄微环混沌光频梳的Tbit/s并行实时物理随机数方案. 必威体育下载 , doi: 10.7498/aps.73.20231913
[2]	全旭, 邱达, 孙智鹏, 张贵重, 刘嵩. 一个具有共存吸引子的四阶混沌系统动力学分析及FPGA实现. 必威体育下载 , doi: 10.7498/aps.72.20230795
[3]	张贵重, 全旭, 刘嵩. 一个具有超级多稳定性的忆阻混沌系统的分析与FPGA实现. 必威体育下载 , doi: 10.7498/aps.71.20221423
[4]	张亚君, 蔡佳林, 乔亚, 曾中明, 袁喆, 夏钶. 基于磁性隧道结的群体编码实现无监督聚类. 必威体育下载 , doi: 10.7498/aps.71.20220252
[5]	王童, 温娟, 吕康, 陈健中, 汪亮, 郭新. 仿生生物感官的感存算一体化系统. 必威体育下载 , doi: 10.7498/aps.71.20220281
[6]	武长春, 周莆钧, 王俊杰, 李国, 胡绍刚, 于奇, 刘洋. 基于忆阻器的脉冲神经网络硬件加速器架构设计. 必威体育下载 , doi: 10.7498/aps.71.20220098
[7]	康志伟, 刘拓, 刘劲, 马辛, 陈晓. 基于自归一化神经网络的脉冲星候选体选择. 必威体育下载 , doi: 10.7498/aps.69.20191582
[8]	吕晏旻, 闵富红. 基于现场可编程逻辑门阵列的磁控忆阻电路对称动力学行为分析. 必威体育下载 , doi: 10.7498/aps.68.20190453
[9]	王传福, 丁群. 基于混沌系统的SM4密钥扩展算法. 必威体育下载 , doi: 10.7498/aps.66.020504
[10]	许雅明, 王丽丹, 段书凯. 磁控二氧化钛忆阻混沌系统及现场可编程逻辑门阵列硬件实现. 必威体育下载 , doi: 10.7498/aps.65.120503
[11]	郭业才, 周林锋. 基于脉冲耦合神经网络和图像熵的各向异性扩散模型研究. 必威体育下载 , doi: 10.7498/aps.64.194204
[12]	邵书义, 闵富红, 吴薛红, 张新国. 基于现场可编程逻辑门阵列的新型混沌系统实现. 必威体育下载 , doi: 10.7498/aps.63.060501
[13]	张旭东, 朱萍, 谢小平, 何国光. 混沌神经网络的动态阈值控制. 必威体育下载 , doi: 10.7498/aps.62.210506
[14]	潘晶, 齐娜, 薛兵兵, 丁群. 基于现场可编程门阵列的手机短信息混沌加密系统设计方案及硬件实现. 必威体育下载 , doi: 10.7498/aps.61.180504
[15]	刘强, 方锦清, 赵耿, 李永. 基于FPGA技术的混沌加密系统研究. 必威体育下载 , doi: 10.7498/aps.61.130508
[16]	高博, 余学峰, 任迪远, 李豫东, 崔江维, 李茂顺, 李明, 王义元. 静态存储器型现场可编程门阵列总剂量辐射损伤效应研究. 必威体育下载 , doi: 10.7498/aps.60.036106
[17]	周武杰, 禹思敏. 基于现场可编程门阵列技术的混沌数字通信系统——设计与实现. 必威体育下载 , doi: 10.7498/aps.58.113
[18]	周武杰, 禹思敏. 基于IEEE-754标准和现场可编程门阵列技术的混沌产生器设计与实现. 必威体育下载 , doi: 10.7498/aps.57.4738
[19]	何国光, 曹志彤. 混沌神经网络的控制. 必威体育下载 , doi: 10.7498/aps.50.2103
[20]	马余强, 张玥明, 龚昌德. Hopfield神经网络模型的恢复特性. 必威体育下载 , doi: 10.7498/aps.42.1356

计量

文章访问数: 122
PDF下载量: 8
被引次数: 0

姓名
邮箱
手机号码
标题
留言内容
验证码

搜索

留言板

Implementation of a High-Efficiency, Lightweight Residual Spiking Neural Network Processor Based on FPGA

摘要

Abstract

施引文献

计量

作者中心

必威betway88欢迎你

关于期刊

关于我们

搜索

留言板

Implementation of a High-Efficiency, Lightweight Residual Spiking Neural Network Processor Based on FPGA

摘要

Abstract

施引文献

计量

出版历程

作者中心

必威betway88欢迎你

关于期刊

关于我们