对于图像识别等许多 AI 工作负载来说,出色的并行性对于系统性能至关重要。因此,早期的 AI 研究人员很快采用了 GPU,以获得出色的计算并行性。
GPU 最初专为渲染视频和图像而设计,因此在并行处理方面表现出色,并且可以并行执行大量算术运算。如果需要连续多次执行相同的计算,那么 GPU 可以提供显著的加速性能。但 GPU 有其局限性,对于特定的深度学习应用来说,其性能不如专为 AI 设计的 ASIC。而,ASIC 本身也有一定的局限性,例如一次性工程 (NRE) 成本高昂且开发周期较长(开发、验证和制造可能需要 12 个月到几年的时间)。
FPGA 可提供类似 ASIC 的硬件定制功能,并且可以通过编程为 AI 工作负载提供类似 GPU 或 ASIC 的性能,但开发周期却很短。FPGA 具有可重新编程和可重新配置的特性,非常适合快速发展的 AI 领域。设计人员可以利用高性能解决方案快速测试算法并推向市场。
一篇名为“FPGA 与 GPU 在深度学习方面的比较”的新文章详细探讨了这些内容。该文章讨论了 FPGA 在深度学习应用中的独特优势,并介绍了英特尔独特的 FPGA 相关产品,包括:
▪ 英特尔® FPGA 和 AI 优化型英特尔®Stratix® 10 NX FPGA
▪ 英特尔® OpenVINO™ 工具套件分发版
▪ 英特尔® FPGA 深度学习加速套件
▪ 面向 OpenCL™ 软件技术的英特尔® FPGA SDK
详情可点击“阅读原文”。
文章来源于英特尔FPGA