MySQL HeatWave Database Service 的特性

一个 MySQL 云数据库服务,满足 OLTP、OLAP 和 ML 三种需求

MySQL HeatWave 服务支持数据库管理员、开发人员和数据分析师直接从 MySQL Database 运行 OLTP、OLAP 和机器学习 (ML) 工作负载。

消除 ETL

无需执行复杂、耗时且成本高昂的 ETL 流程和集成,也无需额外的分析数据库和 ML 服务。

实时分析

事务更新会自动、实时复制到 HeatWave 分析集群,分析查询可以始终访问最新数据。在运行分析查询之前无需编录数据索引。

实时分析 JSON 文档

开发人员和 DBA 可以利用 HeatWave 对存储在 MySQL Database 中的 JSON 文档进行实时分析,从而按文档数量级加快分析查询速度。

全自动化的数据库内机器学习

借助 HeatWave AutoML,您可以在 MySQL HeatWave 中快速轻松地构建、训练、部署和解释机器学习模型,无需将数据迁移到单独的 ML 云技术服务,更无需成为 ML 专家。

增强安全性

MySQL Database 和 HeatWave 集群节点之间的所有静态数据和传输中数据始终都是加密的。由于不需要在数据存储之间传输数据,ETL 流程不存在数据泄露风险。

无需更改 MySQL 应用

HeatWave 是一个原生 MySQL 解决方案,现有 MySQL 应用无需更改即可正常运行。

采用现有商务智能 (BI)、数据可视化和机器学习工具

HeatWave 同样支持 MySQL Database 所支持的 BI 和数据可视化工具,包括 Oracle Analytics Cloud、Tableau 和 Looker。HeatWave AutoML 还与 Jupyter 和 Apache Zeppelin 等主流记事本相集成。

可在公有云环境和您的本地数据中心运行

您可以在 OCI、AWS 或 Azure 上部署 MySQL HeatWave,将数据从本地部署 OLTP 应用复制到 MySQL HeatWave,无需 ETL 即可执行近乎实时的分析。您还可以借助 OCI Dedicated Region,在您的本地数据中心使用 MySQL HeatWave。


高性能的内存中查询加速器

HeatWave 是一个内存中大规模并行的混合列查询处理引擎。它可提供先进的算法,实现超高的分布式查询处理性能。

采用大规模扩展和高性能架构设计

HeatWave 可将数据大规模分区到一组可并行运行的 HeatWave 节点上,提供出色的节点间可扩展性。集群内的每个节点和节点内的每个核心都可以并行处理分区数据。同时,HeatWave 搭载了一个智能查询调度器,可并行处理计算与网络通信任务,为数千个核心提供高度的可伸缩性。

针对云技术进行了优化

HeatWave 查询处理已针对云端商用服务器进行了优化。首先,分区大小经过专门优化,即使基础配置的缓存也能正常运行。其次,计算与通信重叠特性也针对可用网络带宽进行了优化。最后,各种分析处理原语使用底层虚拟机 (VM) 的硬件指令。

针对高事务处理量和连接进行了优化

Oracle MySQL Autopilot 可改善 MySQL HeatWave 线程池的性能,通过一种可优化硬件资源使用的机制进一步提高性能。由此,MySQL HeatWave 可为 OLTP 工作负载提供更高的吞吐量,并防止在事务并发级别较高时吞吐量下降。


MySQL HeatWave Lakehouse

MySQL HeatWave 包含 MySQL HeatWave Lakehouse,支持用户查询对象存储中的半 PB 数据,包括 CSV、Parquet、Avro 以及其他数据库中的导出文件等各种文件格式。查询处理完全在 HeatWave 引擎中完成,客户除了可以利用 HeatWave 处理与 MySQL 兼容工作负载之外,还可以处理非 MySQL 工作负载。借助 HeatWave Lakehouse,MySQL HeatWave 可以在一个云数据库服务中执行事务处理、机器学习以及跨数据仓库和数据湖的数据分析,无需在云技术服务之间执行 ETL 流程。

针对所有数据,快速执行数据池分析和机器学习

除了查询对象存储中各种格式的数据,客户还可以使用标准 MySQL 命令查询 SQL 数据库中的事务数据,或同时执行这两种查询。10 TB TPC-H 基准测试结果显示,MySQL 在对象存储中查询数据的速度与查询数据库的速度一样快。

通过 HeatWave AutoML,客户可以使用对象存储和/或数据库中的数据,自动构建、训练、部署和解释机器学习模型,而无需将数据迁移至单独的机器学习云技术服务。

面向数据管理和查询处理的横向扩展架构

HeatWave 的大规模分区架构可为 MySQL HeatWave Lakehouse 提供一个横向扩展架构,支持根据数据规模扩展或收缩查询处理和数据管理操作(如加载/重新加载数据)。客户可以使用 MySQL HeatWave Lakehouse 在对象存储中查询多达半 PB 数据,且无需将数据复制到 MySQL 数据库。HeatWave 集群可扩展至 512 个节点。

利用基于机器学习的自动化功能提高性能,节省时间

MySQL HeatWave Lakehouse 不仅增强了已有的自动供应、自动查询计划改进和自动并行加载等 MySQL Autopilot 功能,进一步降低数据库管理开销并提高性能,还推出了新的 MySQL Autopilot 功能。

  • 自动模式推断可针对所有支持的文件类型(包括 CSV)自动推断文件数据到对应模式定义的映射。因此,客户无需手动定义和更新文件的模式映射,从而节省大量时间和精力。
  • 自适应数据采样可智能地对对象存储中的文件进行抽样,并推导信息供 MySQL Autopilot 执行自动化预测。借助自适应数据采样,MySQL Autopilot 可在不到一分钟的时间内对 400 TB 文件的模式映射完成扫描并执行预测。
  • 自适应数据流让 MySQL HeatWave Lakehouse 可动态适应任何区域中底层对象存储的性能,改善整体性能、性价比和可用性。

使用 AutoML 运行数据库中机器学习

HeatWave AutoML 免费为用户提供在 MySQL HeatWave 中构建、训练、部署和管理机器学习模型所需的一切资源。

无需额外的机器学习服务

借助 MySQL HeatWave 的数据库内机器学习,客户不需要将数据迁移到其它机器学习服务。客户可以使用 MySQL Lakehouse,轻松、安全地将存储在 HeatWave 和对象存储中的数据应用于机器学习训练、推断和解释。加速推进机器学习计划、增强安全性并降低成本。

利用机器学习生命周期自动化节省时间并减轻工作量

HeatWave AutoML 能够推动机器学习生命周期自动化,包括算法选择、面向模型训练的智能数据采样、特征选择和超参数优化,为数据分析师和数据科学家节省大量时间和精力。您还可以对算法选择、特征选择和超参数优化等机器学习管道选项进行自定义。HeatWave AutoML 支持异常检测、预测、分类、回归和推荐系统任务,包括在文本列中。

个性化推荐系统

HeatWave AutoML 推荐系统可以基于隐式反馈(如购买历史和浏览行为)和显式反馈(如评分、点赞)来生成个性化推荐方案。分析人员可以预测用户可能会喜欢的商品、特定商品能够吸引的用户以及某个商品的评分。还可以根据某个用户,获取相似用户的列表;或根据特定的产品,获取相似产品的列表。

交互式 MySQL HeatWave AutoML 控制台

交互式控制台支持业务分析师在一个可视界面中轻松构建、训练、运行和解释 ML 模型,无需使用 SQL 命令或编写任何代码。此外,它还能简化 What-if 场景分析,帮助企业评估业务假设,例如“追加 30% 的付费社交媒体广告投资将对收入和利润产生哪些影响?”

可解释的机器学习模型

经 HeatWave AutoML 训练的所有模型都可解释。HeatWave AutoML 可提供预测并解释结果,在合规性、公平性、可重复性、因果关系和信任方面为企业提供强大支持。

运用现有的技能

使用 HeatWave AutoML,开发人员和数据分析师不必学习新的工具和语言,可以使用熟悉的 SQL 命令构建机器学习模型。此外,HeatWave AutoML 还与 Jupyter 和 Apache Zeppelin 等主流记事本相集成。


生成式 AI 和 MySQL HeatWave 向量存储

目前在私有预览中,向量存储支持客户利用大型语言模型 (LLM) 的功能及专有数据,其准确性比仅使用公开数据进行训练的模型更高。通过生成式 AI 和向量存储功能,客户可以使用自然语言与 MySQL HeatWave 交互,并高效地在 HeatWave Lakehouse 中搜索各种格式的文档。

向量存储以各种格式(如 PDF)摄取文档,并将其存储为通过编码器模型生成的嵌入。对于给定的用户查询,向量存储将对所存储的嵌入和嵌入式查询执行相似性搜索,以此识别相似度高的文档。这些文档将用于增强给 LLM 的提示,使其能够提供更符合情境的答案。


MySQL Autopilot:基于内置机器学习的自动化

MySQL Autopilot 提供工作负载感知、基于机器学习的自动化。它无需您拥有数据库调优专业知识即可提高性能和可扩展性,不仅能提高开发人员和 DBA 的工作效率,还有助于消除人为错误。MySQL Autopilot 可自动化执行众多富于挑战的重要操作,包括供应、数据加载、查询执行和故障处理,规模化提供高查询性能。MySQL HeatWave 客户可免费使用 MySQL Autopilot。

MySQL Autopilot 面向 HeatWave 和 OLTP 提供了众多功能。

  • 自动供应:对待分析的表数据进行自适应抽样,预测运行工作负载所需的 HeatWave 节点数量。这意味着开发人员和 DBA 无需手动估算集群大小。
  • 自动线程池:支持数据库服务在指定硬件配置上处理更多事务,为 OLTP 工作负载提供更高的吞吐量,并防止在事务并发水平较高时吞吐量下降。
  • 自动配置预测:持续监视 OLTP 工作负载(包括吞吐量和缓冲池命中率),从而在任意指定时间推荐适当的计算配置,确保客户始终获得理想性价比。
  • 自动编码:判断加载到 HeatWave 的列的最佳表示,从而改善查询性能,尽可能降低集群大小和成本。
  • 自动改进查询计划:基于查询执行的统计信息开展学习,改进未来查询的执行计划。随着查询数量增长,系统性能将越来越高。
  • 自适应查询执行:支持在启动查询执行后,使用各种统计信息来调整数据结构和系统资源,同时根据运行时实际的数据分布,单独优化每个节点的查询执行。这有助于将临时查询的性能提高多达 25%。
  • 自动放置数据:预测应在哪些列上对表进行内存中分区,从而实现最佳的查询性能。它还能预测新列建议可带来的查询性能提升。鉴于操作人员在手动选择列时可能会做出次优选择,这可以尽可能减少跨节点数据移动。
  • 自动压缩可帮助客户判断适合该列的压缩算法,加速数据压缩和解压,进而提高加载和查询性能。通过减少内存使用量,客户可以将成本降低多达 25%。
  • 索引编制功能(有限可用性)自动确定客户应在其表中创建或删除的索引,以优化 OLTP 吞吐量,从而利用机器学习基于各应用工作负载进行预测。这有助于客户消除耗时的任务,也就是为 OLTP 工作负载创建最佳索引以及随着工作负载变化而持续维护这些索引所做的耗时的工作。

实时弹性

实时弹性功能让客户将 HeatWave 集群扩展和缩小到任意数量的节点,无需任何停机时间或只读时间。

在高峰时间始终提供稳定的高性能,同时零停机地降低成本

调整大小的操作只需几分钟即可完成。在此期间,HeatWave 全程保持在线状态,不影响其他操作。操作完成后,数据将从对象存储下载,在所有可用集群节点之间自动重新平衡,然后立即用于查询。因此,客户不仅可以始终享有高性能(即使在高峰时间),还可以在适当的时候缩小 HeatWave 集群来降低成本 — 无需停机或进入只读状态。

通过从对象存储高效地重新加载数据,客户还可以暂停和恢复 HeatWave 集群,降低成本。

避免超额供应实例

客户可以将 HeatWave 集群的大小调整为任意数量的节点。相比其他提供商的刚性集群大小调整模式,这可以避免过度供应和成本浪费。现在,HeatWave 客户只需为自己所使用的资源付费。


全面管理型数据库服务

全面管理型数据库服务可自动处理可用性管理、打补丁、升级和备份等耗时工作,帮助您提高生产力。此外,即时资源供应也能加快应用开发。

由 MySQL 工程团队开发、管理和提供支持

开发人员可即时访问来自 MySQL 团队的新功能,确保交付现代化的云原生数据库应用。系统可自动应用 MySQL 安全补丁,降低安全漏洞风险。MySQL HeatWave 与本地部署 MySQL 完全兼容,支持您无缝迁移到云端,而无需更改应用。

MySQL HeatWave 交互式控制台:管理资源、运行查询和监视性能

开发人员和 DBA 可以轻松创建和管理 MySQL Database 和 HeatWave 节点,不仅可以在控制台中访问自动供应等 MySQL Autopilot 功能,确定 HeatWave 集群的理想配置,还可以查看和管理在 MySQL HeatWave 中加载的表,快速构建和运行查询。

MySQL HeatWave 控制台还支持开发人员和 DBA 监视 MySQL Database 节点和 HeatWave 集群的性能,包括各种硬件资源的使用和各种查询执行指标。

适用于 MySQL HeatWave 的 OCI Database Management

OCI Database Management 提供诊断功能来确保快速解决性能瓶颈问题,从而防止应用中断。该服务可用于主动检测和识别 MySQL HeatWave 性能问题的根本原因。


高级安全性

高级安全功能可帮助客户实施更多安全措施,在整个数据生命周期保护数据安全并满足法规要求。

通过密钥生成和数字签名进行非对称加密

服务器端非对称加密支持开发人员和 DBA 使用公钥和私钥来增强机密数据保护。他们还可以使用数字签名来确认文档签署人员的身份。开发人员无需修改当前应用即可加密数据,并且可以使用相关工具来执行加密、密钥生成和数字签名。

隐藏您的数据

数据脱敏和去标识化即使用替代值隐藏和替换真实的数据值,具体包括选择性脱敏、随机数据替换、模糊等等。借助 MySQL HeatWave 中的数据脱敏和去标识化功能,客户可以在开发和测试环境等非生产系统中隐藏敏感数据,降低数据泄露风险。在 MySQL Database 节点或 HeatWave 集群上执行查询时,您也可以使用数据脱敏功能。

阻止未经授权的数据库活动

MySQL HeatWave 数据库防火墙可监视数据库威胁,自动创建认证 SQL 语句允许列表,阻止未经授权的数据库活动。它可以实时防范 SQL 注入等专门针对数据库的攻击。

注:为免疑义,本网页所用以下术语专指以下含义:

  1. Oracle专指Oracle境外公司而非甲骨文中国。
  2. 相关Cloud或云术语均指代Oracle境外公司提供的云技术或其解决方案。