CNN Plus加速器IP

使用低功率FPGA的AI加速度

定制卷积神经网络(CNN)IP- CNN PLUS IP是一种灵活的加速器IP,通过利用并行处理能力,分布式存储器和DSP资源的格子FPGA来简化超低功耗AI的实现。

可配置的使用方式- 两种实现可用,紧凑或高性能。紧凑型模式是利用FPGA本地存储器的低功耗处理模式。另一方面,高性能模式优化用于较大的网络实现。

易于实现- 使用晶格神经网络共同工具可以编译使用诸如Tensorflow等普通机器学习框架的模型,并使用CNN Plus加速器IP在HW上实现。

特征

  • 按格式NN编译器工具生成的每个命令序列执行一系列计算
  • 可配置资源使用权力与性能之间的权衡
  • bob电子竞技俱乐部支持常见的网络结构,如VGG,MobileNet,Irent和SDD
  • 利用内部和外部内存资源并管理访问以优化性能
  • 神经网络权重的可配置位宽(16位,8位,1位)

跳转到

框图

CNN加IP紧凑型模式框图

CNN Plus IP高性能模式框图

性能和规模

Crosslink-NX性能和资源利用率
配置3. CLK_I,ACLK_I FMAX(MHz)2 切片寄存器 luts. LRAMS. ebrs.4. 逻辑DSP.
Mult9,Mult18 MULT18,PREADD9.
默认 116.401,118.652 2855 3673 2 12. 13,1 13,13
SCATCH PAD内存大小= 4K,其他=默认值 119.962,118.259 2890 3689. 2 15. 13,1 13,13
Scatch Pad内存大小= 8K,其他=默认值 121.832,116.009 2898 3685. 2 19. 13,1 13,13
SCATCH PAD内存大小= 16K,其他=默认值 118.751,113.598 2880. 3703 2 27. 13,1 13,13
内存类型= single_lram,其他=默认值 115.062,113.404 2869 3631. 1 12. 13,1 13,13
机床倾斜类型=优化_cnn 123.609,113.662 5687 7693 2 17. 48,4 48,48
机器倾斜类型=优化_cnn,旋垫存储器大小= 2k,其他=默认 117.564,109.158 5695 7717. 2 21. 48,4 48,48
机器倾斜类型=优化_cnn,旋垫存储器大小= 4k,其他=默认 124.239,118.092 5709 7711. 2 29. 48,4 48,48
机器倾斜类型=优化_cnn,锁定垫内存大小= 8k,其他=默认 120.963,112.133 5707 7706. 2 45. 48,4 48,48
机器倾斜类型=优化_cnn,旋置垫内存大小= 8k,最大突发长度= 256,其他=默认 123.289,120.875 5709 7722 2 45. 48,4 48,48

1.使用不同的软件版本或针对不同的设备密度或速度等级时,性能可能会有所不同。
2.当FPGA设计仅包含CNN Plus Accelerator IP内核时,会产生FMAX。当用户逻辑添加到FPGA设计时,可以减少这些值。
3.“SCATCH PAD存储器大小= * k”中的k值相当于1024条目x 2字节。例如,4k等于8kb的划痕垫存储器。
4.OPTIMIZED_CNN实现有更多的ebr,因为它复制了Convolution scratch存储中的ebr,以支持并行处理。另外,一些重复的子模块有自己的EBR: CONV_EU(每个单元1个EBR)和POOL(2个单元共享1个EBR)。

订购信息

家庭 零件号 描述
CERTUS-NX. CNNPLUS-ACCEL-CTNX-U 单一设计许可证
CERTUS-NX. CNNPLUS-ACCEL-CTNX-UT 多站点许可证
CrossLink-NX cnnplus-accel-cnx-u 单一设计许可证
CrossLink-NX CNNPLUS-ACCEL-CNX-UT 多站点许可证

文件

快速参考
标题 数字 版本 日期 格式 尺寸
CNN Plus Accelerator IP用户指南
FPGA-IPUG-02115 1.1 12/16/2020 PDF. 1.5 MB.

*单击“通知”按钮“通知”按钮,您同意接收关于所选文档的更改的通知。

与大多数网站一样,我们使用cookie和类似的技术来增强您的用户体验。我们还允许第三方在我们的网站上放置Cookie。通过继续使用本网站,您同意使用cookie,如我们所述Cookie政策