CNN Compact Accelerator IP

在mWs中实现机器学习推理

相关应用程序bobappios下载地址


iCE40 UltraPlus移动开发平台

利用FPGA的并行处理能力来实现紧凑的cnn,包括被称为bnn的二进制版本。该IP使您能够在Lattice iCE40 UltraPlus fpga中实现cnn,功耗在mW范围。

该IP使用iCE40 UltraPlus设备的片上DSP资源实现cnn。加速引擎使用11个嵌入式块Ram (EBR)作为工作内存。用户可以选择使用EBR或更大的单端口内存(SPRAM)块来存储引擎使用的重量和指令。

这个IP与网格神经网络编译工具.该编译器采用在普通神经网络训练工具中开发的网络,并允许编译成指令,可以由加速器IP运行。

  • 实现mW功耗深度学习
  • 通过片上DSP和内存块在iCE40 UltraPlus中实现包括bnn在内的cnn
  • 兼容常见的网络结构,如Mobilenet和VGG
  • 网络权值和操作序列存储在EBR或SPRAM块中
晶格sensAI

跳转到

框图

BNN实现

CNN的实现

性能和尺寸

iCE40 UltraPlus在BNN模式下的性能和资源利用率1
内存类型 BNN Blob类型 寄存器 附近地区 EBR 静态存储器 clk Fmax2(MHz)
EBRAM + 1/0 1822 2419 27 0 41.762
DUAL_SPRAM + 1/0 1803 2447 11 2 31.565
single_spram. + 1/0 1802 2430 11 1 41.103
single_spram. + 1/-1 1992 2706 11 1 40.748

1.使用Lattice Radiant Software 1.0.0.350.0和Lattice Synthesis Engine针对iCE40 UP5K-SG48I生成。当使用不同的软件版本或针对不同的设备密度或速度等级时,性能可能会有所不同。
2.当FPGA设计只包含Compact CNN Accelerator IP Core时,会产生Fmax,当用户逻辑添加到FPGA设计时,这些值可能会减少。

iCE40 UltraPlus在CNN模式下的性能和资源利用率1
内存类型 便笺本3. 寄存器 附近地区 EBR 静态存储器 clk Fmax2(MHz)
EBRAM 1 k 1725 2816 23 0 28.164
DUAL_SPRAM 1 k 1706 2867 7 2 27.672
single_spram. 1 k 1705 2841 7 1 26.782
single_spram. 4 k 2052 3989 19 1 25.950

1.使用Lattice Radiant Software 1.0.0.350.0和Lattice Synthesis Engine针对iCE40 UP5K-SG48I生成。当使用不同的软件版本或针对不同的设备密度或速度等级时,性能可能会有所不同。
2.当FPGA设计只包含Compact CNN Accelerator IP Core时,会产生Fmax,当用户逻辑添加到FPGA设计时,这些值可能会减少。
3.Scratch Pad中的K值等于kilobyte。例如,1K等于1kb的临时存储器。

订购信息

家庭 OPN 描述
iCE40 UltraPlus CNN-CPACCEL-UP-U 单一的设计许可证
iCE40 UltraPlus CNN-CPACCEL-UP-UT 多站点设计许可

为了给Compact CNN Accelerator申请一个30天的评估许可,点击这里

文档

快速参考
标题 数量 版本 日期 格式 大小
Compant CNN加速器IP用户指南
fpga - ipug - 02038 1.7 12/16/2020 PDF 1.2 MB

*点击“更改通知”按钮,即表示您同意收到更改所选文件的通知。

像大多数网站一样,我们使用cookie和类似的技术来增强您的用户体验。我们也允许第三方在我们的网站上放置cookie。如继续使用本网站,即表示您同意使用我们所述的cookies饼干的政策