转载自英特尔FPGA
Patricia Kummrow:
“我们相信,凭借其提高性能、降低成本和改善云数据中心架构的能力,IPU 将成为未来数据中心设计的战略要素。”
现代云数据中心的工作负载日益具有结构化特征,包括一系列微服务。虽然以微服务为导向的架构具有许多优势,但由于其分体式性质,也会产生大量的通信开销。这种基础设施开销所消耗的 CPU 周期不会为云服务提供商 (CSP) 带来收入。Srirama、Dhanota 等人最近发表的一篇文章指出,hyperscaler 的微服务开销比率在 31% 到 83% 之间1,如下图所示。
最近,英特尔推出了基础设施处理单元 (IPU)。借助基于 IPU 的架构,CSP 可以将基础设施任务从 CPU 卸载到 IPU,为创收任务释放服务器 CPU 周期,从而实现数据中心收入的最大化。通过将基础设施任务卸载到 IPU,CSP 可以将其服务器 CPU 全部租给客户。
云数据中心就像酒店,而非房子
用房子和酒店做个简单类比有助于解释推动 IPU 发展的工作负载所有权的划分。在家里,我可以在客厅、厨房和餐桌间随意走动。我们家配备了开放式厨房,一应物品都摆放在一个宽敞的房间内,我们可以在各个区域随意走动。
酒店则不同,客房、餐厅和厨房都是独立的区域。酒店员工的工作区域与酒店客人的餐饮区、客房和会面区是分隔的。酒店的不同区域有着不同的功能,一般都装有房门。出于安全原因,在宾客区域和员工区域之间穿行可能需要胸牌。
酒店将宾客区域和员工区域进行分隔,类似于包含 IPU 的数据中心架构将租户和 CSP 工作负载相分离。通过将 IPU 引入数据中心来实现基础设施功能,CSP 的基础设施工作负载可在 IPU 上运行,从而减轻服务器 CPU 的负担,使其可以运行更多的租户应用。
基于 IPU 的数据中心架构提供了几个主要优势:
• 基础设施功能和租户工作负载之间的有效分离,可大幅提升相关功能的效率,从而显著增强系统安全性;
• 租户可以完全控制服务器 CPU,并利用其全部性能;
• 基础设施工作负载的激增不会给服务器 CPU 带来性能问题,这是传统数据中心架构模型中日益严重的问题,详情请见上述统计数据;
• >CSP 可以将基础设施任务从 CPU 卸载到 IPU,为创收任务释放服务器 CPU 周期,从而实现数据中心收入的最大化;
• 通过将基础设施任务卸载到 IPU,CSP 可以将其服务器 CPU 全部租给客户;
• IPU 专为基础设施任务(而不是通用处理)而设计,可以应用硬件加速和更精细调谐的计算功能来显著提升性能和能效;
• IPU 可在云数据中心实现完全无磁盘的服务器架构。在传统的企业数据中心架构中,每台服务器都有其一套附加磁盘驱动器和固态盘用于存储。
对传统数据中心架构而言,由于很难预测每个租户的存储使用,因此必须为每台服务器过度配置存储资源,以处理峰值存储负载。采用无磁盘服务器架构,中央服务可为所有租户提供存储资源。下图显示了一种可能的无磁盘服务器架构。
相比管理数据中心内数十万台服务器组成的庞大存储资源,管理单项中央存储服务要容易得多,且效率也高很多。
数据中心的演变
近年来,英特尔与微软、百度、京东和 VMware 等主要 CSP 紧密合作,推动了数据中心产品的演变。在 IPU 市场,我们的发运量名列前茅,许多产品采用了英特尔® 至强® D CPU、英特尔® FPGA 和以太网组件。第一代基于英特尔 FPGA 的 IPU 平台是我们与超大规模合作伙伴联合设计的,目前已部署到多家 CSP 拥有和运营的数据中心。
在凭借基于 FPGA 的产品开拓 IPU 业务的五年中,我们发现超大规模 CSP 分阶段实现了 IPU 的价值:
• 第 1 阶段:加速网络 – 将常见的网络任务(例如虚拟交换机和防火墙功能)从服务器 CPU 卸载到 IPU。将流量查找和封装/解封装等用户平面功能 (UPF) 从 CPU 卸载到 IPU 可释放 CPU 周期;
• 第 2 阶段:加速存储 – 将存储堆栈从服务器 CPU 卸载到 IPU,以提高存储吞吐量并降低存储复杂性、开销和管理负担;
• 第 3 阶段:加速安全性 – 卸载加密/解密、压缩和其他安全功能,这些功能会消耗服务器 CPU 周期。(这些安全功能通常与第 2 阶段的卸载存储功能相搭配)。此外,IPU 可启动和配置主机系统,通过隔离安全功能和提供独立于 CPU 的信任根进一步增强安全性;
• 第 4 阶段:基础设施处理 – 可能是最复杂的使用场景,用于将管理程序服务管理功能从服务器 CPU 卸载到 IPU。
当前基于英特尔 FPGA 的 IPU 将英特尔® Stratix® 10 FPGA 与英特尔® 至强® D 处理器相结合。它们组合了优化加速器(采用基于 FPGA 的可配置数据路径)与软件可编程 CPU – 可安全地加速和管理数据中心的基础设施功能。这种混合 IPU 架构支持以硬件速度进行网络管理,并提供所需的软件灵活性,帮助更轻松地实现控制平面功能。使用 FPGA 板载资源的基于硬件的数据路径,与基于软件的控制平面(与 IPU 板载处理器上的基础设施操作系统堆栈协同运行)均具有可编程性,能够为这些 IPU 提供强大功能。相比 SmartNIC,IPU 的不同在于它是一个安全独立的控制点,不可由租户工作负载直接访问。
展望 IPU 和 SmartNIC
展望未来,我们将推出更多 IPU,它们将搭载更先进的处理器、FPGA、甚至集成式 ASIC,同时继续夯实现有的强大 IPU 软件基础,帮助云运营商和生态系统厂商构建更强大的云编排软件。在此前的英特尔架构日,我们宣布了两个新的 IPU(Mount Evans 和 Oak Springs Canyon)和英特尔 N6000 加速开发平台(以前的代号为 Arrow Creek)。
此前的 Big Spring Canyon 平台获得了巨大成功,作为后续产品,Oak Springs Canyon (OSC) 平台搭载了英特尔® Agilex™ FPGA – 目前,其性能、功耗和工作负载效率在 FPGA 行业均排在前列。2 OSC 与基于英特尔® 至强® CPU 的服务器协同运行,可提供卸载 2x100G 工作负载所需的基础设施加速能力。OSC 拥有丰富的软件生态系统,其针对英特尔® CPU、包括英特尔开放 FPGA 堆栈 – 一种可扩展、源代码可访问的软件和硬件基础设施(可帮助我们的合作伙伴和客户创建定制的解决方案)- 进行了优化。OSC 的能力和特性能够满足将采用 100G 网络的下一波 CSP 部署的需求。
作为英特尔的另一个新开发项目,英特尔 N6000 加速开发平台(以前的代号为 Arrow Creek)是一个基于 FPGA 的 SmartNIC 100GbE 网络加速开发平台 (ADP)。该平台以广受欢迎的英特尔® FPGA 可编程加速卡(英特尔® FPGA PAC)N3000 为基础,这款加速卡目前已部署到一些世界知名的通信服务提供商 (CoSP) 运营的数据中心。这款全新的英特尔 N6000 加速开发平台基于英特尔 Agilex FPGA 和英特尔® 以太网控制器 E810。它能够与英特尔架构服务器一起使用,并支持多种类型的基础设施任务,可帮助电信提供商加速各种工作负载,例如 Juniper Contrail、OVS 和 SRv6。
英特尔宣布了我们基于 ASIC 的首款 IPU,它是我们与一家大型 CSP 合作设计的,代号为 Mount Evans。Mount Evans IPU 基于先进的数据包处理引擎,在 ASIC 中进行了实例化。该 ASIC 支持许多现有用例 – 包括 vSwitch 卸载、防火墙和虚拟路由,同时为未来的用例提供了巨大的扩展空间。通过利用和扩展英特尔® 傲腾™ NVMe 控制器,Mount Evans IPU 能够以非常高的 IOPS 速率模拟 NVMe 器件。在基于 FPGA 的 IPU 上运行的英特尔基础设施操作系统也将在 Mount Evans 上运行。
Mount Evans IPU 的其他技术创新包括下一代可靠传输协议(该协议由我们与 CSP 合作伙伴联合打造,旨在解决有耗网络上的长尾延迟问题),以及我们的先进加密和压缩加速器。
IPU:面向 CSP 的全新战略资源
IPU 是英特尔云战略中的一个战略要素。我们强大的 IPU 产品组合提供了通用基础设施基础,有助于我们的云客户在不久将推出的异构数据中心架构中充分利用其通用计算、XPU 和加速资源。这些功能的融合完美契合了微服务持续发展的良好趋势,为构建与高速硬件网络组件和通用软件框架相匹配,经过优化且基于功能的基础设施提供了独特的机会。IPU 为 CSP 提供了重新审视数据中心架构、加速云计算以及在数据中心的每个服务器 CPU 上托管更多创收服务(在虚拟机上运行的租户应用)的机会。
我们相信,凭借其提高性能、降低成本和改善云数据中心架构的能力,IPU 将成为未来数据中心设计的战略要素。