过去 25 年来,IBM 和 Intel 之间的长期合作关系使数据库性能取得了显着进步。根据 IBM 的内部测试,英特尔最新一代英特尔® 至强® 可扩展处理器与英特尔软件相结合,有可能提高 IBM® watsonx.data 的性能。
IBM watsonx.data 是一个混合的、受治理的数据湖中心,针对数据、分析和 AI 工作负载进行了优化。主要亮点包括使用 Presto 和 Spark 等引擎推动业务分析。此外,watsonx.data 跨混合云环境提供灵活的方法和统一的数据视图。
6 月,IBM 发布了下一代 Presto C++,由 Meta、IBM、Uber 等开源社区成员开发。该查询引擎是与 Intel 使用 Velox 合作开发的,Velox 是一个开源 C++ 本机加速库,旨在可跨多个计算引擎进行组合。 IBM 还将 Presto C++ 引擎的发布与基于数十年经验的查询优化器配对,通过优化的查询重写进一步提高查询性能。
Amazon Elastic Compute Cloud (EC2) R7iz 实例是内存优化的高 CPU 性能实例。它们是云中速度最快的基于第四代 Intel Xeon 可扩展 (Sapphire Rapids) 的实例,具有 3.9 GHz 持续全核睿频频率。1 R7iz 实例的性能比上一代 z1d 实例高出 20%,并降低总拥有成本 (TCO)。它们包括英特尔® 高级矩阵扩展(英特尔® AMX)等内置加速器,为人工智能工作负载需求不断增长的客户提供了市场急需的替代方案。
高 CPU 性能和高内存占用量的结合使 R7iz 实例适合前端电子设计自动化 (EDA)、每核许可费用较高的关系数据库工作负载,以及财务、精算和数据分析模拟工作负载。
英特尔和 IBM 密切合作,将开源软件优化引入 Presto、Presto C++ 和 watsonx.data。结合硬件的改进,Intel 4th Gen Xeon 在 watsonx.data 上取得了良好的结果。
IBM watsonx.data 与 急速C++ v0.286 和 查询优化器 在 AWS ROSA 上,在 Intel 处理器上运行(4th 一代)经过 IBM 内部测试,能够交付 更好的性价比 比 Databrick 的 Photon 引擎, 更好的 查询运行时间为 类似的成本,源自公共 100TB TPC-DS 查询基准(请参阅下面的注释)。
尝试 IBM watsonx.data 体验数据的未来
* 注意:此声明基于在 AWS r7iz.4xlarge EC2 实例上对 Presto C++ v0.286 进行的 IBM 内部测试,该实例配备第四代 Intel Xeon 可扩展处理器 (Sapphire Rapids),具有 1 个主节点 + 84 个工作节点、1260 个 vCPU、10.08 TB 内存、高达 12.5 Gbps 的网络,与 2021 年发布的公共 Databricks 100TB TCP-DS 查询基准相比,具有 1 个主节点 + 256 个工作节点、2112 个 vCPU、16.1 TB 内存、528.2 TB 总存储和 10GB 网络。定价计算基于截至 2024 年 5 月 7 日的 IBM watsonx.data 定价和截至 2024 年 5 月 7 日的 Databricks 发布的 Photon 定价。结果基于所示日期的测试条件和定价。实际成本和性能将根据各个客户端配置和条件而有所不同。结果源自 100TB TPC-DS 查询基准,因此与已发布的 Databricks SQL 8.3 基准结果不可比较,因为结果不符合 100TB TPC-DS 查询基准规范。
这篇文章有帮助吗?
是的不