在《生命·觉者》梁冬对话北大教授刘丰一节目中,他们通过宇宙全息论提出这么一个理论:最快的速度并不需要计算的参与,而是直接通过大脑Download我们需要的信息。从哪儿下载?他们给出的答案是“天然的数据中心”。然而理论终究是理论,现实中以人类的水平不可能打造出这样神奇的数据中心,何况仅在技术发展的路上我们就已不断遭遇阻碍。
英特尔高级数据分析中心
据Cisco测算,2015年至2020年全球数据中心IP流量将增长三倍,而我国数据中心IP流量规模在2020年将达到8.6ZB……正如当前时代的数据信息量不断呈指数形式增长一样,当恐怖的数据洪流奔腾而来,我们的数据中心似乎很难有能力去处理应对。
尤其近年来,物联网的发展以及市场对大数据和人工智能(AI)需求的增长更是将数据流量牵引至高处,数据中心运作倍感吃力。面对如此庞大的数据量,我们迫切需要寻求能高效的进行数据分析的方法以帮助从中提取有效信息。
新兴技术浪潮一波未平一波又起,在这跌宕起伏的情节中又快速发展起一种大规模并行计算领域,这个领域一直由GPU主导(GPU专为在单一数据流上最大化高速流水线上吞吐量而构建),它主要通过海量算法来模拟行为计算。而在通用计算与复杂工作处理方向,CPU依旧是大哥。在大数据与AI浪潮下,这两兄弟联手也可谓难逢敌手。但毕竟双拳难挡四手,有能力不代表也能跟上各种严格的苛求,尤其对“速度”的要求。
相比之下,FPGA同时拥有流水并行和数据并行架构,且延迟比GPU低,速度更快,能够针对每一种应用算法定制硬件架构,非常适用于数据中心加速应用,因而英特尔这位芯片巨头对FPGA数据中心业务板块寄予厚望。此外,数据中心还是英特尔公司的第二大业务。早在2015年收购Altera时英特尔便已承诺会给数据中心带来突破,那时它就已预测到2020年将有30%的服务器配备FPGA,并且一直在努力抓住这片市场。
英特尔公开的信息显示,FPGA正逐渐被部署到多个云服务提供商的数据中心中,相比于传统的服务器和硬件加速器,这些FPGA节点可以在更低的功耗下提供若干个量级的性能增长,同时因其硬件可编程的特点,FPGA还可以对工作负载或需要实现的功能进行灵活的处理和配置。
在基因测序的工作中,基于平均每秒千兆细胞更新数(GCUPS) 性能,使用英特尔FPGA 加速运行Pair-HMM 算法可使得总体基因业务流性能提升50倍,总业务流提升1.2倍。
而在关键的企业级应用中,海量的实时数据必须由机器智能进行处理,以便在毫秒量级的时间范围内做出有效决策。这些应用包括广告的实时出价、欺诈检测、视频分析以及弹性搜索等。同时,需要高吞吐量的内存数据库、对延时敏感的语音识别,以及其他工作负载如基因测序等,都可以在这些基于FPGA的计算平台上轻松且以超快的速度实现。例如英特尔FPGA在微软的Bing搜索和Azure云服务里的应用。
新款可编程加速卡,为数据中心急剧降压
不久前,英特尔就面向数据中心推出了全新款加速神器——基于英特尔® Stratix® 10 SX FPGA的英特尔® 可编程加速卡(PAC)。这是首款基于高端FPGA的全新加速卡,它在性能、能效、密度和系统集成度方面都拥有业界领先的突破性优势。
其中使用的FPGA采用了革命性的英特尔® Hyperflex™ FPGA 架构,且基于英特尔14纳米三栅极制程工艺构建。与上一代高性能FPGA相比,其内核性能提升了2倍,更是降低了高达70%的功耗。尤其它通过借助面向英特尔® 至强® CPU及FPGA的加速栈,能够为数据中心开发人员提供强大的平台以部署基于FPGA的加速工作负载。
英特尔在数据中心应用方向上,可谓“用情极深”。在去年10月,英特尔公司就已面向数据中心推出了首款基于英特尔® Arria® 10 FPGA(中端FPGA)的可编程加速卡。全新版本的PAC继承了前一代的多数性能,同样支持设计合作伙伴生态系统,致力于交付更广泛应用工作负载的加速IP。
但不同的是新款PAC的外形更大,更是专为内嵌处理和内存密集型工作负载而构建,如流分析和视频转码等;而外形较小的采用英特尔® Arria® 10 FPGA的PAC则更适用于回溯测试、数据库加速和图像处理等工作负载。
英特尔可编程解决方案事业部产品市场总监Sabrina Gomez对此曾表示:“这是英特尔第二款可编程加速器产品,它可以极大地丰富我们面向数据中心可编程加速器平台整个产品的组合。但所谓丰富,并不是要取代之前的加速卡产品,因为这些不同代的产品能力、大小和功耗设计是不一样的,互为补充,并不是有了这款功能更强大的产品就取代了之前一代的产品。”
全新一代采用英特尔® Stratix® 10 SX FPGA的英特尔® 可编程加速卡(PAC)拥有280万个逻辑单元,其处理能力是其Arria 10同类产品的近三倍。同样地,Stratix器件配备244 Mb嵌入式存储器和支持高达26 Gbps的SERDES收发器。其板载内存更“宽敞”,具有高达32 GB的DDR4和2 GB的四SPI闪存。
新款基于高性能 PCI Express* (PCIe*) 的 FPGA加速卡还能够为数据中心提供内联和旁路加速支持,可在英特尔可编程加速卡(英特尔® PAC)产品组合上扩展,能够为视频转码和流分析应用提供最高100 Gbps 的内联高速接口。提供FPGA加速的卓越性能和多功能性,并得到了面向包含FPGA的英特尔至强处理器的加速堆栈的支持。同时,面向英特尔® 至强® CPU及FPGA的加速栈还为应用和加速器函数开发人员提供了一个通用开发接口,并且包括驱动程序、应用编程接口(API)和一个FPGA接口管理器。
全新款PAC产品给了客户更大的选择空间,客户可以根据他所需要的性能、带宽、功耗以及体积的要求,选择适合他们自己的加速卡产品。加速堆栈与加速库以及开发工具的共同协作也节省了开发人员的大量时间,并能够支持他们在多个英特尔FPGA平台上重复使用代码。采用英特尔® Stratix® 10 SX FPGA的多功能英特尔可编程加速卡(PAC)可在众多细分市场中实施,具体包括:
● 流分析:对来自应用、传感器和设备的数据流进行实时分析,以实时制定决策
● 金融技术:利用金融服务领域的加速技术实现银行、投资和风险管理的自动化
● 基因组:该科学领域专注于基因组结构、功能、进化、映射和它们的影响
● 视频转码:将某种格式的视频流转换为其他格式,使视频可以在不同的平台和设备上播放
对于英特尔这款全新的PAC加速卡,HPE副总裁兼HPC与AI事业部总经理Bill Mannel表示:“我们看到基于 FPGA 的加速器市场增长迅速,越来越多的开发人员(无论专业知识如何)都可采用全新的英特尔® FPGA 解决方案工具,实现工作负载加速。我们计划在我们的产品中使用英特尔® Stratix® 10 PAC 和加速栈,以帮助客户轻松管理复杂及新涌现的工作负载。”英特尔公司则表示,加速卡还将继续以数据中心应用为主,但在未来会扩展到更多的行业,包括联网、基础设施、物联网、边缘计算等等。
借助FPGA+生态的力量,重磅加速数据市场
如今的数据中心已支持虚拟机,在云数据中心迁移时,考虑到基于FPGA的云储机和隔离问题,非常有必要和通用加速卡做成软件栈,支持云化卡。正如英特尔软件堆栈一样,它能为开发人员节省时间,比如像数学家、金融分析师等用户,他们不需要了解FPGA如何使用就可以完成自己的需求,就可以专注于提高解决方案的独特价值。此外,它还支持开发商和生态系统更轻松地开发和部署英特尔 FPGA以优化工作负载。
英特尔加速卡拥有非常广泛的合作伙伴支持,重点就在于英特尔软件堆栈和生态系统能够支持在数据中心内无缝集成,并能够提供从芯片到协调层的整个过程以及从晶片到编排层端到端的支持。
内容来自:英特尔FPGA