HeatWaveの機能

HeatWave

HeatWaveは超並列でインメモリのハイブリッドな列指向のデータ処理エンジンです。非常に高いパフォーマンスを実現する分散クエリ処理向けの最先端のアルゴリズムを実装しています。

大規模なスケーリングとパフォーマンスを実現する設計

HeatWaveは並列で運用できるノード・クラスタにデータを大規模にパーティショニングします。この結果、ノード間のスケーラビリティが優れています。クラスタ内の各ノードとノード内の各コアは分割されたデータを並列で処理できます。HeatWaveは、数千コアにわたる非常に高いスケーラビリティを実現するために、コンピューティングがネットワーク通信タスクと重複するインテリジェントなクエリ・スケジューラを実装しています。

クラウドとオブジェクト・ストレージ内のデータに最適化

HeatWaveのクエリ処理はクラウド上のコモディティ・サーバーに最適化されています。パーティションのサイズは、基盤となる形状のキャッシュに合わせて最適化されています。コンピューティングの通信との重複はネットワーク帯域幅に最適化されています。さまざまな分析処理プリミティブでは、基盤となる仮想マシン(VM)のハードウェア命令を使用します。また、HeatWaveはスケールアウト・データ処理エンジンとして設計されており、オブジェクト・ストレージ内のデータのクエリ・データに最適化されています。


HeatWave GenAI

HeatWave GenAIは、データベース内の大規模言語モデル(LLM)、自動化されたデータベース内のベクトルストア、自然言語でのコンテキストに応じた対話機能など、統合的で自動化された生成AIを提供し、AIの専門知識やデータ移動なしに生成AIを活用できるようにします。

データベース内のLLM

すべてのOracle Cloud Infrastructure(OCI)リージョン、OCI専用リージョン、およびクラウド全体にわたり、組み込みの最適化されたLLMを使用し、導入全体にわたり予測可能なパフォーマンスで一貫した結果を得ます。GPUのプロビジョニングが不要になるため、インフラストラクチャ・コスト削減を支援します。

OCI Generative AIとの統合

OCI生成AIサービスを通じて、CohereとMetaから事前トレーニング済みの基礎モデルにアクセスします。

データベース内ベクトル・ストア

HeatWaveベクトル・ストアに格納されたさまざまな形式のLLMや独自のドキュメント全体にわたり取得拡張生成(RAG)を実行し、データを別のベクトル・データベースに移動することなく、より正確でコンテキストに関連した回答を取得します。

組み込みの自動生成

HeatWave Vector Storeにある独自ドキュメントの発見と取り込みを支援する自動化パイプラインを活用することで、AIの専門知識がない開発者やアナリストでもベクトル・ストアをより簡単に利用できるようになります。

スケールアウト・ベクトルの処理

ベクトル処理は、最大512のHeatWaveクラスタ・ノード全体にわたり並列化され、メモリ帯域幅で実行されるため、精度が低下する可能性を低減した高速な結果を支援します。

HeatWave Chat

オブジェクト・ストレージ内の非構造化ドキュメントから自然言語を用いてコンテキストに応じた会話を行います。統合的なLakehouse Navigatorを使用して、LLMが特定のデータ・セットを検索できるように支援することで、コストを削減しながら、より正確な結果を迅速に得ることができます。

HeatWave GenAIの詳細を見る


HeatWave MySQL

HeatWave MySQLは、暗号化、データ・マスキング、認証、データベース・ファイアウォールなどの高度なセキュリティ機能を備えた、フルマネージドのデータベース・サービスであり、MySQL Enterprise Editionをベースに構築された唯一のクラウド・サービスです。HeatWaveは、MySQLのクエリ・パフォーマンスを桁違いに向上させ、複雑さ、レイテンシ、リスク、コストを伴うETL(抽出、変革、ロード)を別の分析データベースに重複させることなく、MySQLでトランザクション・データをリアルタイム分析することを可能にします。

ETLを使用しないリアルタイム分析

トランザクションからの更新がHeatWave分析クラスタにリアルタイムで自動的にレプリケーションされるため、分析クエリは最新のデータにアクセスできます。分析クエリを実行する前にデータをインデックス化する必要はありません。複雑で時間とコストのかかるETLプロセス、および別の分析データベースとの統合を排除できます。

HeatWave GenAIの詳細を見る


HeatWave Lakehouse

HeatWave Lakehouseはオブジェクト・ストレージに格納された最大1/2ペタバイトのデータをクエリできます。データは、CSV、Parquet、Avro、JSON、他のデータベースからのエクスポートファイルなど、さまざまなファイル形式に対応しています。クエリ処理はすべてHeatWaveエンジンで行われるため、MySQL互換のワークロードだけでなく、MySQL以外のワークロードでもHeatWaveを活用することができます。

すべてのデータに対して高速なレイクハウス分析と機械学習を実行

MySQLデータベースのトランザクション・データ、オブジェクト・ストレージ内のさまざまな形式のデータ、またはその両方の組み合わせに対して、標準のSQLコマンドを使用してクエリを実行できます。10 TB TPC-H ベンチマークで実証されたように、オブジェクト・ストレージ内のデータのクエリは、データベース内のクエリと同じくらい高速です。

HeatWave AutoMLを使用すると、オブジェクト・ストレージ、データベース、またはその両方にあるデータを使用して、MLモデルを自動的に構築、トレーニング、導入、説明できます。

データ管理とクエリ処理の増大に対応するスケールアウト・アーキテクチャ

HeatWaveの大規模パーティショニング・アーキテクチャにより、Lakehouse向けのスケールアウト・アーキテクチャを実現しています。クエリ処理およびデータ管理操作(データのロード/再ロードなど)は、データのサイズに合わせてスケーリングします。Lakehouseでは、MySQLデータベースにコピーすることなく、オブジェクト・ストレージ内の最大1/2ペタバイトのデータをクエリできます。HeatWaveクラスタは512ノードまで拡張可能です。

機械学習を活用した自動化で、パフォーマンス向上と時間短縮を実現

自動プロビジョニングやクエリ計画の自動改善、自動パラレル・ロードなど、Autopilot機能をLakehouse向けに強化することで、データベース管理のオーバーヘッドのさらなる削減とパフォーマンスの向上を実現しています。HeatWave Lakehouseでは、新しいHeatWave Autopilot機能も使用できます。

  • 自動スキーマ推論は、CSVを含むサポートされているすべてのファイルタイプについて、対応するスキーマ定義へのファイルデータのマッピングを自動的に推論します。その結果、お客様はファイルのスキーマ・マッピングを手動で定義および更新する必要がなくなり、時間と労力を節約できます。
  • アダプティブ・データ・サンプリングは、オブジェクト・ストレージからファイルをインテリジェントにサンプリングし、HeatWave Autopilot が自動化のための予測に使用する情報を抽出します。アダプティブ・データ・サンプリングを使用することで、HeatWave Autopilotは400 TBのファイルを1分以内にスキャンし、スキーマ・マッピングなどの予測を行うことができます。
  • アダプティブ・データ・フローにより、 Lakehouseは、どのリージョンにおいても、元となるオブジェクト・ストアのパフォーマンスに動的に適応し、全体的なパフォーマンス、価格性能、可用性を向上させます。

eatWave Lakehouseの詳細を見る


HeatWave AutoML

HeatWave AutoMLには、HeatWave内で機械学習モデルを構築、トレーニング、および説明するために必要なすべてが含まれているため、追加コストは不要です。

個別の機械学習サービスは不要

HeatWaveのデータベース内機械学習では、お客様はデータを別の機械学習サービスに移動する必要はありません。MySQL内部とHeatWave Lakehouseのオブジェクトストアの両方に保存されたデータに対して、機械学習のトレーニング、推論、説明を簡単かつセキュアに適用できます。この結果、MLへの取り組みを促進し、セキュリティを強化し、コストを削減できます。

機械学習ライフサイクルの自動化で時間と労力を削減

HeatWave AutoMLは、アルゴリズムの選択、モデル・トレーニングのためのインテリジェントなデータ・サンプリング、機能の選択、ハイパーパラメータの最適化など、機械学習のライフサイクルを自動化するため、データ・アナリストとデータ・サイエンティストの時間と労力を大幅に削減します。アルゴリズムの選択、機能の選択、ハイパー・パラメータの最適化など、機械学習パイプラインの機能をカスタマイズできます。HeatWave AutoMLは、異常検知、予測、分類、回帰、推奨システムなどのタスクをサポートし、これらはテキスト列に対しても実行できます。

推奨システムによる推奨のパーソナライズ

HeatWave AutoMLの推奨システムは、暗黙的なフィードバック(過去の購入履歴、閲覧行動など)と明示的なフィードバック(評価、「いいね!」など)の両方を考慮することで、パーソナライズされた推奨事項を生成することができます。例えば、アナリストは、ユーザーが好むアイテム、特定のアイテムを好むユーザー、アイテムの評価などを予測することができます。さらに、ユーザー情報をもとに類似ユーザーのリストを取得したり、特定のアイテムに基づき類似アイテムのリストを取得したりすることもできます。

インタラクティブなHeatWave AutoMLコンソール

インタラクティブなコンソールにより、ビジネスアナリストはSQLコマンドやコーディングを一切使用せずに、ビジュアル・インターフェースを使用してMLモデルを構築、トレーニング、実行、説明することができます。また、コンソールでは、ビジネス上の仮定を評価するためのwhat-ifシナリオを簡単に調べることができます。例えば、「ソーシャルメディアの有料広告に30%多く投資すると、収益と利益の両方にどのような影響を与えるか」などです。

説明可能なMLモデル

HeatWave AutoMLでトレーニングされたすべてのモデルは説明可能です。HeatWave AutoMLは、予測結果を説明付きで提供するため、企業コンプライアンス、公平性、再現性、因果関係、および信頼性で企業を支援します。

現在のスキルを活用

開発者とデータ・アナリストは、使い慣れたSQLコマンドで機械学習モデルを構築できるため、新しいツールと言語を学習する必要はありません。また、HeatWave AutoMLは、Jupyter、Apache Zeppelinなど、一般的なノートブックと統合されています。


HeatWave Autopilot

HeatWave Autopilotは、ワークロードを考慮した機械学習による自動化を提供します。データベースのチューニングに関する専門知識を必要とせずにパフォーマンスとスケーラビリティを向上させ、開発者とDBAの生産性を高め、人的ミスを排除することができます。HeatWave Autopilotは、プロビジョニング、データ・ロード、クエリ実行、障害処理など、高いクエリ・パフォーマンスを大規模に実現する際の最も重要で困難になりがちな側面の多くを自動化します。HeatWave MySQLのお客様はHeatWave Autopilotを追加料金なしで使用できます。

HeatWave Autopilotは、HeatWaveおよびOLTPに多数の機能を提供します。

  • 自動プロビジョニングでは、分析が必要なテーブル・データを適応的にサンプリングして、ワークロードの実行に必要なHeatWaveノードの数を予測できます。つまり、開発者とデータベース管理者は最適なクラスタ・サイズを手動で見積もる必要がなくなったということです。
  • 自動スレッド・プーリングを使用すると、特定のハードウェア構成に対してデータベース・サービスが処理できるトランザクション数が増加するため、OLTPワークロードのスループットが向上し、トランザクションおよび並行処理におけるスループットの低下を高レベルで防ぐことができます。
  • 自動シェイプ予測は、スループットやバッファ・プールのヒット率などのOLTPワークロードを継続的に監視して、適切なコンピュート・シェイプをいつでも推奨します。これにより、お客様は最高のコスト・パフォーマンスを常に得ることができます。
  • 自動エンコードでは、クエリを考慮して、HeatWaveにロードされるカラムの最適な表現を判断できます。この最適な表現では、最高のクエリ・パフォーマンスを実現し、クラスタ・サイズを最小限に抑制して、コストも最小限に抑制できます。
  • クエリ・プランの自動改善では、クエリの実行からさまざまな統計を学習し、今後のクエリの実行プランを改善できます。このため、クエリの実行回数が増加するにつれて、システム・パフォーマンスを向上できます。
  • 適応問合せ最適化は、クエリ実行開始後にさまざまな統計情報を使用してデータ構造とシステム・リソースを調整し、実行時の実際のデータ分布に基づいて各ノードのクエリ実行を独立して最適化します。これにより、アドホック・クエリのパフォーマンスが最大25%向上します。
  • データの自動配置は、最高のクエリ・パフォーマンスを実現するために、メモリ内でパーティショニングすべき表の列を予測できます。また、新しい列の推奨によって、想定されるクエリ・パフォーマンスの向上も予測します。このため、オペレーターが手動でカラムを選択する際に行う可能性がある最適ではない選択によるノード間のデータ移行を最小限に抑制できます。
  • 自動圧縮は、列ごとに最適な圧縮アルゴリズムを決定し、より高速にデータを圧縮・解凍することで、負荷とクエリパフォーマンスを向上させます。メモリ使用量を削減することで、お客様はコストを最大25%削減することができます。
  • 索引付け(限定提供)は、OLTPスループットを最適化するために、機械学習を使用して個々のアプリケーションのワークロードに基づいて予測を行い、お客様が表から作成または削除すべき索引を自動的に決定します。これにより、お客様はOLTPワークロードに最適な索引を作成し、ワークロードが変化するにつれてその索引を長期にわたって維持するという、時間のかかる作業を省くことができます。

リアルタイムの弾力性

お客様は、リアルタイムの弾力性によって、ダウンタイムおよび読み取り専用時間なしで、HeatWaveクラスタのサイズを任意のノード数だけ増減できます。

ピーク時でも常に高いパフォーマンスを発揮し、ダウンタイムなしで、コストを削減

サイズ変更操作には、数分しかかかりませんが、その間、HeatWaveは、オンラインのままであり、すべての操作に使用できます。データは、サイズ変更されると、オブジェクト・ストレージからダウンロードされ、使用可能なすべてのクラスタ・ノード間で自動的に再調整され、クエリにすぐに使用できるようになります。この結果、ピーク時でも常に高いパフォーマンスを発揮し、ダウンタイムおよび読み取り専用時間なしで、適切な場合、HeatWaveクラスタをダウンサイジングして、コストを削減します。

オブジェクト・ストレージからの効率的なデータのリロードにより、お客様はHeatWaveクラスタを一時停止および再開してコストを削減することもできます。

プロビジョニングされすぎたインスタンスは不要

お客様はHeatWaveクラスタを任意のノード数に増減できます。これらは、柔軟性のないサイジング・モデルによるプロビジョニングされすぎた高コストのインスタンスに制約されることはありません。ん。お客様は、HeatWaveによって、使用したリソースに応じた料金のみを支払います。


パブリック・クラウドとお客様のデータ・センターで利用可能

HeatWaveは、OCI、AWSまたはAzureに導入できます。オンプレミスのOLTPアプリケーションからHeatWaveにデータをレプリケーションして、ほぼリアルタイムの分析を取得します。HeatWaveは、OCI Dedicated Regionを利用して、お客様のデータセンターで利用することも可能です。

HeatWave on AWSは、AWSのお客様にネイティブなエクスペリエンスを提供します。コンソール、コントロール・プレーンおよびデータ・プレーンはAWSにあります。