可将分析和混合工作负载的 MySQL 性能提高数个量级;可查询对象存储中的数据;无需单独的分析数据库、单独的机器学习 (ML) 工具以及提取、转换和加载 (ETL) 复制。MySQL HeatWave 现已在 Oracle Cloud Infrastructure (OCI)、Amazon Web Services (AWS) 和 Microsoft Azure 上可用。
通过 CloudWorld On Air 观看主题演讲:使用 HeatWave Lakehouse 扩展数据处理的未来趋势。
MySQL HeatWave 是一个由 HeatWave 内存中查询加速器提供支持的全托管数据库服务。该云技术服务将事务处理、机器学习以及跨数据仓库和数据湖的实时分析整合到一个 MySQL Database 中,消除了 ETL 复制的复杂性、延迟、风险和成本。
借助 MySQL HeatWave Lakehouse,客户可以在对象存储中查询半 PB 的数据并利用 HeatWave 的所有优势,即便数据存储在 MySQL Database 外部。借助 HeatWave AutoML,开发人员和数据分析师可以在 MySQL HeatWave 中构建、训练、部署和解释机器学习模型,无需将数据迁移到单独的机器学习服务中。
了解如何处理和查询对象存储中数百 TB 的各种格式的数据,例如 CSV、Parquet 以及其他数据库中的导出文件。
了解为 MySQL HeatWave Lakehouse 提供强大支持的新技术如何助力用户处理和查询对象存储中的半 PB 内存中数据。
了解如何在 AWS 上供应并低延迟地访问 MySQL HeatWave 实例,以及如何将数据迁移到 MySQL HeatWave。
了解 MySQL Autopilot 将如何提升 HeatWave 的性能,显著节约开发人员和数据库管理员的时间。
了解如何在不停机的情况下扩展或收缩至任意数量的节点,零手动干预地实现集群完全平衡。
这家巴西营销技术集成公司通过 Oracle Cloud Infrastructure 上的 MySQL HeatWave,以毫秒级的速度加快获得营销洞察,并将成本降低一半。
Migrate to MySQL HeatWave with free step-by-step resources.
HeatWave 使用内存中列式表示形式,便于向量化处理,而且数据在加载到内存中之前都会进行编码和压缩。此压缩和优化的内存中表示形式用于数字和字符串数据,显著提高性能并减少内存占用,从而降低客户的成本。
HeatWave 引擎的一个关键设计点是将数据大规模分区到一组 HeatWave 节点上,这些节点可以并行运行,为分析操作实现极高的高速缓存命中率,并提供非常好的节点间可扩展性。集群中的每个 HeatWave 节点和节点中的每个核心都可以并行处理分区数据,包括并行扫描、连接、分组、聚合和 top-k 处理。
OLTP 事务更改可实时传播至 HeatWave 并立即在分析查询中呈现。用户将查询提交到 MySQL 数据库后,MySQL 查询优化程序会透明地判断是否将查询卸载到 HeatWave 集群以加速执行。这取决于 HeatWave 是否支持查询所引用的所有运算符和函数,以及使用 HeatWave 处理查询的预计用时是否少于 MySQL。如果两个条件都获满足,查询将被推送到 HeatWave 节点进行处理。处理完毕后,结果将被发送回 MySQL 数据库节点并返回给用户。
HeatWave 为分布式内存中分析处理实现了先进的算法,使用向量化构建和探测联接内核来快速处理分区内的联接。同时,分析节点之间高度优化的网络通信是通过使用异步批处理 I/O 实现的。这些算法旨在将计算时间与节点间数据通信重叠,有助于实现高可扩展性。
MySQL Autopilot 可自动化执行众多富于挑战的重要操作,包括供应、数据加载、查询执行和故障处理,规模化提供杰出查询性能。它使用先进技术对数据进行采样,收集有关数据和查询的统计信息,并构建机器学习模型来对内存使用情况、网络负载和执行时间进行建模。随后,MySQL Autopilot 可使用这些机器学习模型来执行核心功能。得益于 MySQL Autopilot,执行的查询数量越多,HeatWave 查询优化程序就越智能,而这将持续提高系统性能。MySQL Autopilot 还提供了多种功能,可以有效提升 OLTP 工作负载的性能和价格性能比。MySQL HeatWave 客户可免费使用 MySQL Autopilot。
当数据从 MySQL 加载到 HeatWave 时,内存中表示形式的副本会生成到基于 OCI 对象存储的横向扩展数据管理层,而在 MySQL 中对数据所做的更改会透明地传播到此数据层。当操作需要将数据重新加载到 HeatWave 时,例如在错误恢复期间,可以由多个 HeatWave 节点并行地从 HeatWave 数据层访问数据,从而显著提高性能。例如,对于 10 TB HeatWave 集群,恢复和重新加载数据所需的时间从 7.5 小时减少到 4 分钟,速度提高了超过 100 倍。
HeatWave 是一款 MySQL 可插拔的存储引擎,完全屏蔽了客户的所有底层实施详细信息。因此,应用程序和工具可以使用标准连接器通过 MySQL 无缝访问 HeatWave。HeatWave 支持与 MySQL 相同的 ANSI SQL 标准和 ACID 属性,并支持多种数据类型,因此无需更改现有的应用程序即可利用 HeatWave。
本地客户即便因为合规性或法规要求而无法将 MySQL 部署迁移到云端,也能通过混合部署模式使用 HeatWave。在这种混合部署中,客户可以使用 MySQL 复制功能将本地 MySQL 数据复制到 HeatWave — 无需执行 ETL。
借助 MySQL HeatWave 中免费的原生数据库内机器学习,您无需将数据迁移到单独的机器学习服务(例如 Amazon SageMaker),可以有效加快机器学习计划速度、提高安全性并降低成本。HeatWave AutoML 可推动机器学习生命周期自动化,包括算法选择、面向模型训练的智能数据采样、特征选择和超参数调优,为您节省大量时间和精力。使用 HeatWave AutoML,开发人员和数据分析师不必学习新的工具和语言,可以使用熟悉的 SQL 命令构建机器学习模型。此外,HeatWave AutoML 还与 Jupyter 和 Apache Zeppelin 等主流笔记本相集成。HeatWave AutoML 可提供预测并解释结果,在合规性、公平性、可重复性、因果关系和信任方面为企业提供强大支持。
实时弹性功能让客户将 HeatWave 集群扩展和缩小到任意数量的节点,无需任何停机时间或只读时间。调整大小的操作只需几分钟即可完成。在此期间,HeatWave 全程保持在线状态,不影响其他操作。操作完成后,数据将从对象存储下载,在所有可用集群节点之间自动重新分区,然后立即用于查询。因此,即使在高峰时间,客户也可以始终享有高性能,并通过在适当的时候缩小 HeatWave 集群来降低成本,而无需停机或进入只读状态。客户可以告别其他云数据库提供商提供的刚性大小调整模型,无需受限于过度供应的实例。通过从对象存储高效地重新加载数据,客户还可以暂停和恢复 HeatWave 集群,降低成本。
MySQL HeatWave 包含 MySQL HeatWave Lakehouse,支持用户查询对象存储中的半 PB 数据,包括 CSV、Parquet 以及其他数据库中的导出文件等各种文件格式。除了查询对象存储中各种格式的数据,客户还可以使用标准 MySQL 命令查询 MySQL 数据库中的事务数据,或同时执行这两种查询。查询对象存储中的数据与查询数据库的速度一样快。HeatWave 集群可扩展至 512 个节点以处理半 PB 数据,但数据不会复制到 MySQL 数据库。
沙特阿拉伯金融科技初创企业 Tamara 将数据库工作负载迁移到 MySQL HeatWave 后,性能提升了 3 倍,成本降低了 60%。Tamara 的客户数持续增加,目前已有超过 200 万名用户和 3000 家商户。
电信行业全球高科技解决方案提供商 6D Technologies 使用 MySQL HeatWave on AWS 将复杂查询速度提高了 139 倍,不仅简化了 OLTP 和 OLAP 基础设施,同时还为客户提供亚秒级响应。
日本知名的广告网络企业 FANCOMI 通过 MySQL HeatWave 和 Oracle Autonomous Database 提供实时洞察并显著降低成本。
获取价值 300 美元的免费储值。
想了解更多信息?请联系 Oracle 专家。
注:为免疑义,本网页所用以下术语专指以下含义: