CNN小型加速器IP

实现机器学习推论在MWS

充分利用FPGA的并行处理能力来实现紧凑的细胞神经网络包括被称为BNNs二值化版本。这个IP使您能够在莱迪思的iCE40 FPGA的UltraPlus型有在分子量范围的功耗实现细胞神经网络。

此IP采用片上的iCE40 UltraPlus型设备的DSP资源来实现细胞神经网络。十一的嵌入式RAM块(EBR)作为由加速引擎工作记忆。用户可以选择使用EBR或较大的单端口存储器(SPRAM)块用于存储由发动机使用的权重和指令。

这个IP是搭配的格神经网络编译工具。编译器会在共同NN训练工具开发的网络,并允许汇编成可以由加速器IP上运行的指令。

  • 实现细胞神经网络包括使用芯片上的DSP和存储器模块中iCE40 UltraPlus型BNNs
  • 实现与mW的功耗深度学习
  • 网络重量和操作顺序存储在任一EBR或SPRAM块
  • 调整不同BNN功能的操作和网络权不改变FPGA RTL
格印象之美

跳到

框图

BNN实现

CNN实现

性能和尺寸

iCE40 UltraPlus型性能及BNN模式资源利用1
内存类型 BNN BLOB类型 寄存器 的LUT EBR SRAM CLK的Fmax2(MHz)的
EBRAM +1/0 1822 2419 27 0 41.762
DUAL_SPRAM +1/0 1803 2447 11 2 31.565
SINGLE_SPRAM +1/0 1802 2430 11 1 41.103
SINGLE_SPRAM + 1 / -1 1992年 2706 11 1 40.748

1.使用莱迪思辐射软件1.0.0.350.0与莱迪思综合引擎靶向iCE40 UP5K-SG48I生成。使用不同的软件版本或靶向不同的设备密度或速度等级时,性能可能会有所不同。
当FPGA设计仅包含紧凑CNN加速器IP核心当用户逻辑被添加到FPGA设计中产生的Fmax 2,这些值可以被减少。

iCE40 UltraPlus型性能和CNN模式的资源利用1
内存类型 便笺3 寄存器 的LUT EBR SRAM CLK的Fmax2(MHz)的
EBRAM 1K 1725 2816 23 0 28.164
DUAL_SPRAM 1K 1706 2867 7 2 27.672
SINGLE_SPRAM 1K 1705 2841 7 1 26.782
SINGLE_SPRAM 4K 2052 3989 19 1 25.950

1.使用莱迪思辐射软件1.0.0.350.0与莱迪思综合引擎靶向iCE40 UP5K-SG48I生成。使用不同的软件版本或靶向不同的设备密度或速度等级时,性能可能会有所不同。
当FPGA设计仅包含紧凑CNN加速器IP核心当用户逻辑被添加到FPGA设计中产生的Fmax 2,这些值可以被减少。
3.在便条K值是等效于千字节。例如,1K等于1 KB高速暂存存储器。

订购信息

家庭 OPN 描述
iCE40 UltraPlus型 CNN-CPACCEL-UP-U 单设计许可证
iCE40 UltraPlus型 CNN-CPACCEL-UP-UT 多站点设计许可证

要申请30天的评估许可证的紧凑CNN加速器,点击这里

文档

快速参考
标题 日期 格式 尺寸
COMPANT CNN加速器IP用户指南
FPGA-IPUG-02038 1.6 2020年3月29日 PDF 1.1 MB

*通过点击“更改时通知我”按钮,您同意就改变你选择的文件(S)收到通知。

与大多数网站一样,我们使用cookie和类似的技术来增强用户体验。我们也允许第三方把饼干在我们的网站。继续使用这个网站,你同意使用Cookie和描述我们Cookie政策