在互联网、物联网、大数据的伴随下,数据呈指数增长,随之而来将会面临的是更多的存储需求和挑战。传统的解决方案不足以满足这些存储需求,而软件定义存储确是解决这些问题的最好方案。Gartner预测,2020年70%-80%的非结构化数据将放在由软件定义存储管理的低成本存储设备上。
SoftIron 首席技术官 Phil Straw 在其题为“存储战争:SDS 和必然流行的 Ceph”的文章中,引述 Gartner 的数据表示:“软件定义存储 (SDS) 解决方案可将总体拥有成本降低 50% 或更多,保持出色的性能,同时提升数据服务与软件的稳定性、可用性”。Ceph 是一种开源软件存储平台,可以像处理存储对象一样处理数据,从而简化大数据管理。Ceph 包括一套软件库,可为应用提供对象、数据块、文件存储与检索界面,能够通过在服务器集群中复制数据的方式,提高数据容错性。Straw 随后在文章中补充道,由于受到日益广泛的行业认可,“Ceph 将成为下一个 Linux”。
在一次采访中,Straw 列举了开源软件领域的一些重大成就:
“Linux 操作系统始终能够为显卡提供[需要的]驱动程序。[Linux] 最初并非最佳的操作系统,后来才逐渐成为理想的开源 Unix 类操作系统选择。Apache 则具有 Web 服务器所需的一切。mySQL 实现了与企业数据库的同等特性,两者的特性类同度达到 80%。插入 [MySQL],您便可以处理任何数据库支持的多数操作。Ceph 也具备这种能力,插入之后便可与 OpenStack 良好协同。目前,90% 的 OpenStack 系统都在底层使用 Ceph。Kubernetes 也在快速朝这一方向发展。”
鉴于 Ceph 在软件定义存储领域的中心地位,SoftIron 当前的目标是开发一系列加速 Ceph 设备。该公司的HyperDrive™软件定义存储设备产品组合基于 Ceph 而构建,针对运行 Ceph 的 SDS 应用进行了专门设计和优化。每个 SoftIron HyperDrive 1U 单元都能以线速运行加速版 Ceph,同时保持低于 100 瓦的功耗。
Ceph 所提供的存储容错方案正在不断演进:传统 Ceph 实施方案使用三重数据冗余度,以提升数据的容错率。然而,纠删码 (EC) 方案正在很多场景中取代三重冗余数据存储,该方案可使用冗余数据位扩展和编码原始数据。在通信领域,该技术通常被称为前向纠错 (FEC)。
纠删码可将位级冗余添加至数据,确保原始数据块可从已存储扩展版本的一部分进行恢复。Straw 表示,相比存储三次数据以实现冗余容错,使用纠删码实施容错的数据通常会多占用 55% 的存储空间。对于PB 级数据的存储而言(SoftIron 具备 PB 级的存储支持能力),节省 55% 的存储空间意味着可观的经济效益。
常言道,有得必有失。通过纠删码算法运行 PB 级数据需要大量计算能力。对于处理器,纠删码算法的串行实施会将 SoftIron HyperDrive 存储系统拖慢到不可接受的水平。然而,SoftIron 并未基于软件驱动型处理器实施纠删码算法。该公司使用英特尔® Arria® 10 FPGA 加速纠删码算法以支持 Ceph 应用。结果显示,存储设备可通过 10 Gbps 以太网连接提供线速运行支持,同时节省 55% 的存储空间。
由于可编程逻辑资源可提供高度并行计算功能,任何 FPGA都可提升线速纠删码性能。不过,被问及 SoftIron 为何选择英特尔® Arria® 10 FPGA 时,Straw 表示:
我们只需要RTL,这就要求大量 FPGA 基础设施创建我们的 RTL,英特尔® Arria® 10 FPGA可为该设备类别提供强劲性能。我们还对其进行调整,以适应我们的特定架构。结果表明,英特尔® Arria® 10 FPGA很好地帮助我们实现了该目标。”
除此之外,在 SoftIron HyperDrive 中,英特尔® Arria® 10 FPGA还可加速更多算法。Straw 透露,英特尔的加速功能未来有望应用于纠删码之外的更多领域:
Straw 表示:“我们竭尽所能创造最出色的存储设备,提供卓越的性能、密度、经济性、可靠性和数据保护等。无论在软件还是硬件中,我们都要确保相关功能高效运行。我们将努力构建完美的存储方案。”
内容源自英特尔FPGA