在一个云端数据库服务中执行事务处理、机器学习以及跨数据仓库和数据湖的分析

MySQL HeatWave 是一个由 HeatWave 内存中查询加速器提供支持的全托管数据库服务。该云技术服务将事务处理、机器学习以及跨数据仓库和数据湖的实时分析整合到一个 MySQL Database 中,消除了 ETL 复制的复杂性、延迟、风险和成本。

借助 MySQL HeatWave Lakehouse,客户可以在对象存储中查询半 PB 的数据并利用 HeatWave 的所有优势,即便数据存储在 MySQL Database 外部。借助 HeatWave AutoML,开发人员和数据分析师可以在 MySQL HeatWave 中构建、训练、部署和解释机器学习模型,无需将数据迁移到单独的机器学习服务中。

演示:MySQL HeatWave Lakehouse

了解如何处理和查询对象存储中数百 TB 的各种格式的数据,例如 CSV、Parquet 以及其他数据库中的导出文件。

首要原则:一切均在 OCI 上的 MySQL HeatWave Lakehouse 内部完成

了解为 MySQL HeatWave Lakehouse 提供强大支持的新技术如何助力用户处理和查询对象存储中的半 PB 内存中数据。

演示:在 AWS 上运行 MySQL HeatWave Lakehouse

了解使用基于 AWS 的 MySQL HeatWave Lakehouse 来实时分析查询以及对来自对象存储和/或数据库的数百 TB 数据执行机器学习是多么简单。

演示:MySQL Autopilot

了解 MySQL Autopilot 将如何提升 HeatWave 的性能,显著节约开发人员和数据库管理员的时间。

演示:使用 MySQL HeatWave 支持生成式 AI 和向量存储

了解如何通过支持生成式 AI 和向量存储,以自然语言与 MySQL HeatWave 交互,并使用具有专有数据的大型语言模型 (LLM) 提高准确性。

演示:MySQL HeatWave 性能

观看演示视频,通过 McKnight Consulting Group 的 100 TB TPC-H 基准测试对比 MySQL HeatWave 与 Snowflake、Amazon Redshift、Databricks 和 Google BigQuery 的查询性能和性价比。

查看免费的分步式资源,成功迁移至 MySQL HeatWave。

MySQL HeatWave:专为性能和可扩展性而设计

为提升性能和可扩展性而生的云数据库

HeatWave 使用内存中列式表示形式,便于向量化处理,而且数据在加载到内存中之前都会进行编码和压缩。此压缩和优化的内存中表示形式用于数字和字符串数据,显著提高性能并减少内存占用,从而降低客户的成本。


可跨核心和节点扩展

HeatWave 引擎的一个关键设计点是将数据大规模分区到一组 HeatWave 节点上,这些节点可以并行运行,为分析操作实现极高的高速缓存命中率,并提供非常好的节点间可扩展性。集群中的每个 HeatWave 节点和节点中的每个核心都可以并行处理分区数据,包括并行扫描、连接、分组、聚合和 top-k 处理。


实时分析

OLTP 事务更改可实时传播至 HeatWave 并立即在分析查询中呈现。用户将查询提交到 MySQL 数据库后,MySQL 查询优化程序会透明地判断是否将查询卸载到 HeatWave 集群以加速执行。这取决于 HeatWave 是否支持查询所引用的所有运算符和函数,以及使用 HeatWave 处理查询的预计用时是否少于 MySQL。如果两个条件都获满足,查询将被推送到 HeatWave 节点进行处理。处理完毕后,结果将被发送回 MySQL 数据库节点并返回给用户。


分布式内存中分析处理提供实时洞察

HeatWave 为分布式内存中分析处理实现了先进的算法,使用向量化构建和探测联接内核来快速处理分区内的联接。同时,分析节点之间高度优化的网络通信是通过使用异步批处理 I/O 实现的。这些算法旨在将计算时间与节点间数据通信重叠,有助于实现高可扩展性。


MySQL Autopilot:基于机器学习的自动化

MySQL Autopilot 可自动化执行众多富于挑战的重要操作,包括供应、数据加载、查询执行和故障处理,规模化提供高查询性能。它使用先进技术对数据进行采样,收集有关数据和查询的统计信息,并构建机器学习模型来对内存使用情况、网络负载和执行时间进行建模。随后,MySQL Autopilot 可使用这些机器学习模型来执行核心功能。得益于 MySQL Autopilot,执行的查询数量越多,HeatWave 查询优化程序就越智能,而这将持续提高系统性能。MySQL Autopilot 还提供了多种功能,可以有效提升 OLTP 工作负载的性能和价格性能比。MySQL HeatWave 客户可免费使用 MySQL Autopilot。


数据恢复速度提升高达 100 倍

当数据从 MySQL 加载到 HeatWave 时,内存中表示形式的副本会生成到基于 OCI 对象存储的横向扩展数据管理层,而在 MySQL 中对数据所做的更改会透明地传播到此数据层。当操作需要将数据重新加载到 HeatWave 时,例如在错误恢复期间,可以由多个 HeatWave 节点并行地从 HeatWave 数据层访问数据,从而显著提高性能。例如,对于 10 TB HeatWave 集群,恢复和重新加载数据所需的时间从 7.5 小时减少到 4 分钟,速度提高了超过 100 倍。


内置分析功能,无需更改应用

HeatWave 是一款 MySQL 可插拔的存储引擎,完全屏蔽了客户的所有底层实施详细信息。因此,应用程序和工具可以使用标准连接器通过 MySQL 无缝访问 HeatWave。HeatWave 支持与 MySQL 相同的 ANSI SQL 标准和 ACID 属性,并支持多种数据类型,因此无需更改现有的应用程序即可利用 HeatWave。


混合云技术 — 本地部署 OLTP,云端部署 OLAP

本地客户即便因为合规性或法规要求而无法将 MySQL 部署迁移到云端,也能通过混合部署模式使用 HeatWave。在这种混合部署中,客户可以使用 MySQL 复制功能将本地 MySQL 数据复制到 HeatWave — 无需执行 ETL。


使用 AutoML 运行数据库中机器学习

借助 MySQL HeatWave 中免费的数据库中机器学习,您无需将数据迁移到单独的机器学习服务(例如 Amazon SageMaker),可以有效加快机器学习计划速度、提高安全性并降低成本。客户可以使用 MySQL Lakehouse,将存储在 HeatWave 和对象存储中的数据应用于机器学习训练、推断和解释。HeatWave AutoML 可推动机器学习生命周期自动化,包括算法选择、面向模型训练的智能数据采样、特征选择和超参数调优,为您节省大量时间和精力。

使用 HeatWave AutoML,开发人员和数据分析师不必学习新的工具和语言,可以使用熟悉的 SQL 命令构建机器学习模型。此外,HeatWave AutoML 还与 Jupyter 和 Apache Zeppelin 等主流记事本相集成。HeatWave AutoML 可提供预测并解释结果,在合规性、公平性、可重复性、因果关系和信任方面为企业提供强大支持。


生成式 AI 和 MySQL HeatWave 向量存储

目前在私有预览中,向量存储支持客户利用大型语言模型 (LLM) 的功能及专有数据,其准确性比仅使用公开数据进行训练的模型更高。通过生成式 AI 和向量存储功能,客户可以使用自然语言与 MySQL HeatWave 交互,并高效地在 HeatWave Lakehouse 中搜索各种格式的文档。

向量存储以各种格式(如 PDF)摄取文档,并将其存储为通过编码器模型生成的嵌入。对于给定的用户查询,向量存储将对所存储的嵌入和嵌入式查询执行相似性搜索,以此识别相似度高的文档。这些文档将用于增强给 LLM 的提示,使其能够提供更符合情境的答案。


始终保持稳定的高性能,成本更低且无停机时间

实时弹性功能让客户将 HeatWave 集群扩展和缩小到任意数量的节点,无需任何停机时间或只读时间。调整大小的操作只需几分钟即可完成。在此期间,HeatWave 全程保持在线状态,不影响其他操作。操作完成后,数据将从对象存储下载,在所有可用集群节点之间自动重新分区,然后立即用于查询。因此,即使在高峰时间,客户也可以始终享有高性能,并通过在适当的时候缩小 HeatWave 集群来降低成本,而无需停机或进入只读状态。客户可以告别其他云数据库提供商提供的刚性大小调整模型,无需受限于过度供应的实例。通过从对象存储高效地重新加载数据,客户还可以暂停和恢复 HeatWave 集群,降低成本。


跨数据库和对象存储快速执行分析

MySQL HeatWave Lakehouse 支持用户查询对象存储中的半 PB 数据,包括 CSV、Parquet、Avro 以及其它数据库中的导出文件等各种文件格式。查询处理完全在 HeatWave 引擎中完成,客户除了可以利用 HeatWave 处理与 MySQL 兼容工作负载之外,还可以处理非 MySQL 工作负载。除了查询对象存储中各种格式的数据,客户还可以使用标准 MySQL 命令查询 SQL 数据库中的事务数据,或同时执行这两种查询。查询对象存储中的数据与查询数据库的速度一样快。通过 HeatWave AutoML,客户可以使用对象存储和/或数据库中的数据,自动构建、训练、部署和解释机器学习模型,而无需将数据迁移至单独的机器学习云技术服务。HeatWave 集群可扩展至 512 个节点以处理半 PB 数据,但数据不会复制到 MySQL 数据库。


MySQL HeatWave 客户成功案例

Tamara 利用 MySQL HeatWave 和 Oracle Cloud 快速拓展业务

沙特阿拉伯金融科技初创企业 Tamara 将数据库工作负载迁移到 MySQL HeatWave 后,不仅性能提升了 3 倍,成本也降低了 60%。Tamara 的客户数持续增加,目前已有超过 200 万名用户和 3000 家商户。

6D Technologies 使用 MySQL HeatWave on AWS 解密数据和执行分析

电信行业全球高科技解决方案提供商 6D Technologies 使用 MySQL HeatWave on AWS 将复杂查询速度提高了 139 倍,不仅简化了 OLTP 和 OLAP 基础设施,同时还为客户提供亚秒级响应。

FANCOMI 利用 MySQL HeatWave 将广告分析速度提高了 10 倍

日本知名的广告网络企业 FANCOMI 通过 MySQL HeatWave 和 Oracle Autonomous Database 提供实时洞察并显著降低成本。

在 OCI 或 AWS 上体验 MySQL HeatWave

了解 MySQL HeatWave


免费试用 MySQL HeatWave

获取价值 300 美元的免费储值。


联系我们

想了解更多信息?请联系 Oracle 专家。

注:为免疑义,本网页所用以下术语专指以下含义:

  1. Oracle专指Oracle境外公司而非甲骨文中国。
  2. 相关Cloud或云术语均指代Oracle境外公司提供的云技术或其解决方案。