CNN +加速器IP

使用低功耗fpga实现ai加载

客制化工卷积网(CNN)IP- CNN Plus IP是一级灵活的加载器IP,通度莱迪思FPGA的并行管理力,分布均可和DSP资源,轻松实现超低功耗ai。

可用的使用模式- 提供两种实现模式:低低(compact)和高性能。低能耗模式是使用fpga本地仪器的低功耗致理性。

易于实现- 采用纹orflow等常见常见的机器学院框架框架出来的模型可用莱迪思莱迪思网站器工具进,然后通过cnn加载器IP在上面实现。

特兰

  • 对对神经网页仪器工具生成的每条命令序列执行一定的计算
  • 资源使用可配置,平均功耗和性能
  • 能够以低能耗模式和高性能模式行
  • 使用内部和外荷存储,致理性访问访问从而化性能
  • 可配置的神经网络权重位(16位,8位,1位)

跳转到

框图

cnn plus ip低能耗模式框框图

cnn plus ip高性能模式框框图

性能和尺寸

Crosslink-NX性能和资源利用率
配置3. CLK_I,ACLK_I FMAX(MHz)2 切片寄存器 luts. LRAMS. ebr4. 逻辑DSP
Mult9,Mult18 MULT18,PREADD9.
默认 116.401, 118.652 2855 3673 2 12. 13,1 13,13
SCATCH PAD内存大小= 4K,其他=默认值 119.962, 118.259 2890 3689. 2 15. 13,1 13,13
刮板内存大小=8K,其他=默认值 121.832,116.009 2898 3685. 2 19. 13,1 13,13
刮板内存大小=16K,其他=默认 118.751,113.598 2880 3703 2 27. 13,1 13,13
内存类型= single_lram,其他=默认值 115.062,113.404 2869 3631. 1 12. 13,1 13,13
机床倾斜类型=优化_cnn 123.609,113.662 5687 7693 2 17. 48,4 48,48
机器倾斜类型=优化_cnn,旋垫存储器大小= 2k,其他=默认 117.564,109.158 5695 7717. 2 21. 48,4 48,48
机器倾斜类型=优化_cnn,旋垫存储器大小= 4k,其他=默认 124.239,118.092 5709 7711. 2 29. 48,4 48,48
机器倾斜类型=优化_cnn,锁定垫内存大小= 8k,其他=默认 120.963,112.133 5707 7706. 2 45. 48,4 48,48
机器倾斜类型=优化_cnn,旋置垫内存大小= 8k,最大突发长度= 256,其他=默认 123.289,120.875 5709 7722 2 45. 48,4 48,48

1.使用不同的软件版本或针对不同的设备密度或速度等级时,性能可能会有所不同。
2.当FPGA设计仅包含CNN Plus Accelerator IP内核时,会产生FMAX。当用户逻辑添加到FPGA设计时,可以减少这些值。
3.“SCATCH PAD存储器大小= * k”中的k值相当于1024条目x 2字节。例如,4k等于8kb的划痕垫存储器。
4.OPTIMIZED_CNN实现有更多的ebr,因为它复制了Convolution scratch存储中的ebr,以支持并行处理。另外,一些重复的子模块有自己的EBR: CONV_EU(每个单元1个EBR)和POOL(2个单元共享1个EBR)。

钱购信息

产品系列 订购牌 描述
CrossLink-NX cnnplus-accel-cnx-u 单次设计许可
CrossLink-NX CNNPLUS-ACCEL-CNX-UT 站点站点可

文档

快速参考
标题 编号 版本 日期 格哈 文件大小
CNN Plus Accelerator IP用户指南
FPGA-IPUG-02115 1.2 5/27/2021 PDF. 1.1 MB.
与大多数网站一样,我们使用cookie和类似的技术来增强您的用户体验。我们还允许第三方在我们的网站上放置Cookie。通过继续使用本网站,您同意使用cookie,如我们所述Cookie政策