卷积神经网站(CNN)批量化加热器IP

实现毫瓦级机器学院管理

利用FPGA的并行监理援助力批量化CNN,包括包括化的BNN版本。该IP能让您在莱迪思ICE40 UltraPlus FPGA上实现CNN,功耗仅为毫瓦级。

该IP使用ICE40 UltraPlus器材的片上DSP资源来实现CNN。加入引擎使使11个嵌入式嵌入式仪器作为(EBR)工作室。用途可选择ebr或更大的单位口仪器(SPRAM)来存储引擎引擎使的权重和指令。

该加热器IP与莱迪思神经网站器具工具复合使用。编译源器在常见的神经的神经的神经的网站训练工具中开发的网站,编译成可加入器IP运行的指令。

  • 使用ICE40 ULTRAPLUS片上DSP和存储器模块实现CNN和BNN
  • 实现毫瓦级功耗深度学习
  • 在EBR或SPRAM中
  • 在不出FPGA RTL的情况下,调整不宜BNN功能的语作和网站
格子Sensai.

跳转到

框图

BNN方向实现

CNN方便

性能和尺寸

在BNN模式下ICE40 UltraPlus的性能和资源使用情况1
存储类型 bnn blob类型. 寄存器 lut. EBR. SRAM. CLK FMAX.2(MHz)
ebram. +1/0 1822年 2419. 27. 0. 41.762.
dual_spram. +1/0 1803 2447. 11. 2 31.565.
single_spram. +1/0 1802年 2430. 11. 1 41.103
single_spram. + 1 / -1 1992年 2706 11. 1 40.748

1.使用莱迪思辐射1.0.0.350.0搭配搭配莱迪思合在ICE40 UP5K-SG48I器件上生成的数码。使用不足的所版本或不代表或等级不足密度速度等级件时,性能可爱会有不错的。
2. Fmax是在FPGA设计仅包含系化CNN加热器IP核时生成,当用户逻辑加加到FPGA设计时,该数量可以降低。

在CNN模式下ICE40 UltraPlus的性能和资源使用情况1
存储类型 暂存器3. 寄存器 lut. EBR. SRAM. CLK FMAX.2(MHz)
ebram. 1K. 1725. 2816. 23. 0. 28.164
dual_spram. 1K. 1706 2867. 7. 2 27.672
single_spram. 1K. 1705. 2841. 7. 1 26.782
single_spram. 4K. 2052年 3989 19. 1 25.950.

1.使用莱迪思辐射1.0.0.350.0搭配搭配莱迪思合在ICE40 UP5K-SG48I器件上生成的数码。使用不足的所版本或不代表或等级不足密度速度等级件时,性能可爱会有不错的。
2. Fmax是在FPGA设计仅包含系化CNN加热器IP核时生成,当用户逻辑加加到FPGA设计时,该数量可以降低。
3.仪器一列中间“k”相当于“kb”。例如,1k是指1kb大小的旋转器。

钱购信息

产品系列 opn. 描述
ICE40 UltraPlus. CNN-CPACCEL-UP-U 单次设计许可
ICE40 UltraPlus. CNN-CPACCEL-UP-UT 多重设计可口

点击此处获取料量化CNN加载器为期间30天的评估可。

文章

快速参考
标题 版本 日期 格哈 文件大小
Compant CNN Accelerator IP用户指南
FPGA-IPUG-02038 1.7 12/16/2020 PDF. 1.2 MB.
与大多数网站一样,我们使用cookie和类似的技术来增强您的用户体验。我们还允许第三方在我们的网站上放置Cookie。通过继续使用本网站,您同意使用cookie,如我们所述Cookie政策