晶格的博客bob88体育登陆

分享:

使用FPGA优化始终开启,推断应用程序bobappios下载地址

使用FPGA优化始终开启,推断应用程序bobappios下载地址
Deepak Bopanna于2018年10月8日发布

张贴在

新一代基于人工智能的边缘计算应用对性能有广泛的要求。bobappios下载地址但是,开发人员如何才能在不影响性能的前提下,以较低的成本开发出耗电少、占用资源少的边缘解决方案呢?

为实现目标设计人员需要硅,使它们能够利用快速改变的网络架构和算法。它们还需要解决方案,允许它们使用各种I / O接口。最后,他们需要解决方案,通过自定义量化,将允许它们对功耗进行折衷精度。

fpga可以在这一过程中发挥关键作用。机器学习通常需要两种类型的计算工作负载。在第一个训练阶段,系统从现有数据中学习新的能力。例如,系统通过分析成千上万的图像来识别一只鸟。由于这个早期训练阶段是高度计算密集型的,传统上它是使用高性能硬件(如数据中心中的gpu)来执行的。

在机器学习的第二阶段,称为推理,AI系统通过识别模式并将培训的模型应用于新的最近收集的数据来扩展他们的知识。通过这种方式,系统在工作时学习并随着时间的推移提高其智力。但是,鉴于延迟要求,升级隐私问题和通信带宽限制,设计人员在许多情况下不能在云中进行推理。相反,他们必须在边缘上靠近其数据的源头进行推理。

然而,在网络边缘,在数据中心中使用浮点计算的深度学习技术是不切实际的。设计人员必须开发更高效的解决方案,不仅满足精度目标,而且符合通常在消费者和工业物联网市场中发现的严格电力,成本和足迹要求。在边缘设备,必须使用算术进行推断,该算法尽可能少的比特。实现这一目标的一种方法是从浮点切换到固定点数学。通过改变执行训练的方式来补偿浮点的量化对固定点整数,设计人员可以开发出速度更高的精度训练的解决方案。

开发人员在哪里可以找到在网络边缘执行推断所需的平台?一种解决方案是fpga内置的并行处理能力。由于FPGA的硬件结构不是固定的,功能逻辑单元执行,它们之间的互连由开发者决定。这使得开发人员可以对FPGA进行编程,以并行的方式而不是以顺序的方式同时执行多个进程。

但任何针对边缘的解决方案也必须具有高功率效率。历史上的fpga,特别是密度更高的fpga,消耗了相对较高的功率水平。但新一代低密度、低功耗fpga正在改变这种看法。

Lattice的iCE40 UltraPlus和ECP5 FPGA家族都是为了满足这种不断变化的需求而设计的。构建基于ai的高效解决方案的设计师可以使用ECP5系列将神经网络加速至1W,使用iCE40 UltraPlus系列将神经网络加速至mW范围。

为了帮助开发人员更快地进入市场,Lattice最近还推出了业界首个用于低功耗、广泛市场物联网解决方案的完整技术堆栈。称为晶格Sensai.,这种全面的生态系统结合了硬件套件,神经网络IP核心,软件工具,参考设计和定制设计服务。bob体育软件此外,Sensai Demos和常见的AI用例提供了对象检测的开发,关键词检测和其他流行的总体ON,AI解决方案的蓝图。

显然,在为智能家居、智能城市、智能汽车和智能工厂应用提供具有竞争力的基于人工智能的解决方案时,今天的开发者仍然面临着许多挑战。bobappios下载地址但简化和加速广泛市场的人工智能解决方案开发所需的关键组件显然已经到位。

分享:

像大多数网站一样,我们使用cookie和类似的技术来增强您的用户体验。我们也允许第三方在我们的网站上放置cookie。如继续使用本网站,即表示您同意使用我们所述的cookiesCookie政策