CNN紧凑型加速器IP

实施MWS中的机器学习推理

利用FPGA的并行处理能力来实现紧凑的CNN,包括已知为BNN的二值化版本。此IP使您可以在MW范围内具有电力消耗的晶格ICE40 UltraPlus FPGA中的CNN。

此IP使用ICE40 UltraPlus设备的片上DSP资源来实现CNN。11嵌入式块RAM(EBR)用作加速度引擎的工作存储器。用户可以选择使用EBR或较大的单端口存储器(SPRAM)块来存储引擎使用的权重和指令。

此ip与该IP配对格子神经网络编译器工具。编译器采用公共NN培训工具中开发的网络,并允许编译成可由Accelerator IP运行的指令。

  • 使用片上DSP和存储器块实现CNN,包括ICE40 UltraPlus中的BNN
  • 用MW功耗实施深度学习
  • 存储在EBR或SPRAM块中的网络权重和操作序列
  • 在不改变FPGA RTL的情况下调整不同BNN功能的操作和网络权重
格子Sensai.

跳到

框图

BNN实现

CNN实现

性能和规模

ICE40在BNN模式下UltraPlus性能和资源利用1
内存类型 bnn blob type. 寄存器 luts. EBR. SRAM. CLK FMAX.2(MHz)
ebram. +1/0 1822年 2419. 27. 0. 41.762.
dual_spram. +1/0 1803 2447. 11. 2 31.565.
single_spram. +1/0 1802年 2430. 11. 1 41.103
single_spram. + 1 / -1 1992年 2706 11. 1 40.748

1.使用晶格辐射软件1.0.0.350.0生成,晶格合成发动机瞄准ICE40 UP5K-SG48i。使用不同的软件版本或针对不同的设备密度或速度等级时,性能可能会有所不同。
2.当FPGA设计仅包含Compact CNN Accelerator IP核时,产生FMAX,当用户逻辑添加到FPGA设计时,这些值可能会降低。

CNN模式中的ICE40 UltraPlus性能和资源利用1
内存类型 便笺3. 寄存器 luts. EBR. SRAM. CLK FMAX.2(MHz)
ebram. 1K. 1725. 2816. 23. 0. 28.164
dual_spram. 1K. 1706 2867. 7. 2 27.672
single_spram. 1K. 1705. 2841. 7. 1 26.782
single_spram. 4K. 2052年 3989 19. 1 25.950.

1.使用晶格辐射软件1.0.0.350.0生成,晶格合成发动机瞄准ICE40 UP5K-SG48i。使用不同的软件版本或针对不同的设备密度或速度等级时,性能可能会有所不同。
2.当FPGA设计仅包含Compact CNN Accelerator IP核时,产生FMAX,当用户逻辑添加到FPGA设计时,这些值可能会降低。
3.划痕垫中的k值相当于千字节。例如,1k等于1kb的划痕垫存储器。

订购信息

家庭 opn. 描述
ICE40 UltraPlus. CNN-CPACCEL-UP-U 单一设计许可证
ICE40 UltraPlus. CNN-CPACCEL-UP-UT 多站点设计许可证

要为Compact CNN加速器申请30天的评估许可,点击这里

文件

快速参考
标题 日期 格式 尺寸
Compant CNN Accelerator IP用户指南
FPGA-IPUG-02038 1.6 3/29/2020 PDF. 1.1 MB.

*单击“通知”按钮“通知”按钮,您同意接收关于所选文档的更改的通知。

与大多数网站一样,我们使用cookie和类似的技术来增强您的用户体验。我们还允许第三方在我们的网站上放置Cookie。通过继续使用本网站,您同意使用cookie,如我们所述Cookie政策