CNN加载器IP

使用低功耗FPGA实现AI加速

客制化卷积神经网络(CNN) IP——CNN + IP是一种灵活的加速器IP,通过莱迪思FPGA的并行处理能力,分布式存储器和DSP资源,轻松实现超低功耗人工智能。

可配置的使用模式——提供两种实现模式:低能耗(契约)和高性能。低能耗模式是使用FPGA本地存储器的低功耗处理模式。而高性能模式专为较大的网络实现而优化。

易于实现——采用TensorFlow等常见的机器学习框架训练出来的模型可使用莱迪思神经网络编译器工具进行编译,然后通过CNN +加速器IP在硬件上实现。

特性

  • 对莱迪思神经网络编译器工具生成的每条命令序列都执行一系列的计算
  • 资源使用可配置,平衡功耗和性能
  • 能够以低能耗模式和高性能模式运行
  • 使用内部和外部存储资源,管理访问从而优化性能
  • 可配置的神经网络权重位宽(16位、8位、1位)

跳转到

框图

CNN + IP低能耗模式框图

CNN + IP高性能模式框图

性能和尺寸

CrossLink-NX性能和资源利用率
配置3. Fmax (MHz)2 片寄存器 附近地区 LRAMs ebrs.4 逻辑DSP.
MULT9, MULT18 MULT18, PREADD9
默认的 116.401,118.652 2855 3673 2 12 13日,1 13日13
刮板内存大小=4K,其他=默认 119.962,118.259 2890 3689 2 15 13日,1 13日13
Scatch Pad内存大小= 8K,其他=默认值 121.832, 116.009 2898 3685 2 19 13日,1 13日13
SCATCH PAD内存大小= 16K,其他=默认值 118.751, 113.598 2880. 3703 2 27 13日,1 13日13
内存类型= SINGLE_LRAM别人=违约 115.062, 113.404 2869 3631 1 12 13日,1 13日13
机器类型= OPTIMIZED_CNN倾斜 123.609, 113.662 5687 7693 2 17 48岁的4 48岁的48
机器倾斜类型=OPTIMIZED_CNN, Scatch Pad内存大小=2K,其他=默认 117.564, 109.158 5695 7717 2 21 48岁的4 48岁的48
机器倾斜类型=OPTIMIZED_CNN, Scatch Pad内存大小=4K,其他=默认 124.239, 118.092 5709 7711 2 29 48岁的4 48岁的48
机器倾斜类型=OPTIMIZED_CNN, Scatch Pad内存大小=8K,其他=默认 120.963, 112.133 5707 7706 2 45 48岁的4 48岁的48
机器倾斜类型=OPTIMIZED_CNN, Scatch Pad内存大小=8K,最大突发长度=256,其他=默认 123.289, 120.875 5709 7722 2 45 48岁的4 48岁的48

1.当使用不同的软件版本或针对不同的设备密度或速度等级时,性能可能会有所不同。
2.Fmax是在FPGA设计仅包含CNN Plus加速器IP核时产生的。当用户逻辑被添加到FPGA设计中时,这些值可能会减少。
3.“Scatch Pad Memory Size=*K”中的K值相当于1024个条目x 2个字节。例如,4K等于8kb的临时存储器。
4.OPTIMIZED_CNN实现有更多的ebr,因为它复制了Convolution scratch存储中的ebr,以支持并行处理。另外,一些重复的子模块有自己的EBR: CONV_EU(每个单元1个EBR)和POOL(2个单元共享1个EBR)。

订购信息

产品系列 订购编号 描述
Crosslink-NX. CNNPLUS-ACCEL-CNX-U 单次设计许可
Crosslink-NX. CNNPLUS-ACCEL-CNX-UT 站点许可

文章

快速参考
标题 版本 日期 格式 文件大小
CNN +加速器IP用户指南
fpga - ipug - 02115 1.2 5/27/2021 PDF 1.1 MB
像大多数网站一样,我们使用cookie和类似的技术来增强您的用户体验。我们也允许第三方在我们的网站上放置cookie。如继续使用本网站,即表示您同意使用我们所述的cookies饼干的政策