データレイク

データレイクとは、構造化データ、半構造化データ、非構造化データを、あらゆる形式と規模で、簡単に分析できるリポジトリのことです。Oracle Cloud Infrastructure(OCI)を使用すると、安全でコスト効率に優れ、管理が容易なデータレイクを構築することができます。OCI上のデータレイクは、お客様が希望するデータウェアハウスや分析、またデータカタログ、セキュリティ、観測サービスなど、他のOCIサービスと緊密に統合されます。

データレイクとは (0:44)
任意のデータ、任意のソース

データをバッチまたはストリームでシームレスにOCIデータレイクに移動し、分析することができます。OCI Data IntegrationOCI GoldenGate、または OCI Streamingを利用してデータを取り込み、OCI Object Storageに保存します。

さようなら、データサイロ

OCI上の一元的なデータレイクは、Oracle Autonomous Data WarehouseMySQL HeatWaveなどのデータベース、Oracle Analytics Cloudなどの分析および機械学習 (ML) ツール、Apache Sparkなどのオープン・ソース・プロジェクトなど、お好みのツールと統合できます。

AIとMLを活用する

AIおよびMLサービスの包括的なセットにより、データから新しいインサイトを獲得し、予測を行い、運用上のオーバーヘッドを低減し、カスタマー・エクスペリエンスを向上させることができます。

データを検出し、保護する

OCI Data Catalogを使用して、データをカタログ化し、データレイクに関するインサイトを収集します。クエリ・ツールやデータベースが、オブジェクト・ストア内のデータを検出し、クエリを実行できるようにします。

OCIデータレイクへの早期アクセスを取得

Oracle Cloud Infrastructureは今年、OCIデータレイクと呼ばれるフルマネージドのデータレイク・サービスを開始します。早期アクセスにサインアップしていただくと、一般にリリースされる前に機能や特徴をご確認いただけます。

OCIでデータレイクを使用する理由


データレイクの最新化

データレイクを利用すると、より多くの種類のデータを扱うことが可能になりますが、その分管理に時間と手間がかかることがデメリットになる可能性があります。OCIは、フルマネージドのオープン・ソース・データレイク・サービスを提供することでコストと管理負荷の両方が低減されるため、運用コストの削減、スケーラビリティとセキュリティの向上、そして既存のデータをすべて1か所に組み込むことの実現が期待できます。


データウェアハウスの拡張

データウェアハウスとデータ・マートは、ビジネスの成功に不可欠です。データレイクとの統合により、その価値はさらに高まります。データベース、データウェアハウス、データレイクをオラクルで統合することで、1つのSQLクエリで複数の場所からデータにアクセスすることができます。現在のアプリケーションやツールですべてのデータに透過的にアクセスでき、変更や新しいスキルの習得は不要です。


Oracle Applications向けの高度な分析を活用

エンタープライズ・アプリケーションで生成されるデータには大きな価値がありますが、十分に利用されることはほとんどありません。OCI上のデータレイクは、複数のアプリケーションやデータソースからのデータへのアクセスを簡素化し、四半期の好調と不調の分かれ目となる可能性がある高度な分析を可能にします。

OCI上のデータレイク統合ソリューション

組込みのOCIデータ統合エクスペリエンスでデータを一元化します。

レプリケーションなしで、どのようなソースからでも、あらゆるデータに対してクエリを実行します。

価値実現を即時にかなえる事前統合されたアプリケーション

組込みのOCIデータ・カタログ・エクスペリエンスを用い、カタログ化と管理を行います。

きめ細かい役割ベースのアクセス制御ポリシーで、データを保護します。

オラクルのデータ・プラットフォームがデータの可能性を最大限に引き出す

  • トランザクション・データと分析データを組み合せ、サイロを回避します。
  • Oracle IaaSからOracle SaaSまで、もしくはその間にあるものを活用し、希望する制御量を選択します。
  • あらゆる種類のデータをプラットフォームに取り込み、構造化データと非構造化データの垣根を取り払います。
  • OCIの機能と、移行なしに当社サービスをご利用いただける、他のクラウド・サービス・プロバイダーへの適応性をご確認ください。
  • Oracle Analytics Cloudの主要なレポート、またはサードパーティ製の分析アプリケーションの利用が可能です(OCIはオープン)。
オラクルのデータ・プラットフォームの概要図、説明文は以下の通り この図は、データ・ソース、統合サービスなどのデータ移動サービス、オラクルの最新データプラットフォームの中核、そして考えられる成果やアプリケーション開発サービスなどを備えた、オラクルのデータ・プラットフォームを示しています

Autonomous Databaseとデータレイクの統合

Oracle Autonomous Databaseは、Oracle Cloud Infrastructureだけでなく、Amazon Web Services(AWS)、Microsoft Azure、Google Cloudなどでのデータレイクとの統合もサポートしています。データベースにデータをロードするか、ソース・オブジェクト・ストアにあるデータを直接問合わせるかという選択肢があります。.どちらのアプローチも、データへのアクセスには同じツールやAPIを使用します。

このアーキテクチャは、レイクハウス・アーキテクチャと呼ばれることもあります。



データレイクを用いたAutonomous Databaseの図、説明は以下の通り この図は、データ・ソース、Oracle Autonomous Database、アウトカムを備える、Oracle Autonomous Databaseを活用したデータプラットフォームのアーキテクチャを示します。

MySQL HeatWave Lakehouseですべてのデータをリアルタイム分析

1つのMySQLクラウド・データベース・サービスで、トランザクション、データウェアハウスやデータレイクを横断したリアルタイム分析、機械学習を、ETLの重複による複雑さ、レイテンシ、リスク、コストなしに実現します。

* 公開ベンチマークはこちらからご覧いただけます。



データレイクを用いたAutonomous Databaseの図、説明は以下の通り この図は、データ・ソース、MySQL Heatwaveおよび結果を含む、Oracle MySQL HeatWaveを利用したデータ・プラットフォームのアーキテクチャを示しています。

オラクルが管理するオープン・ソース・サービスでデータレイクを構築

HadoopベースまたはSparkベースのデータレイクをすばやく作成してデータウェアハウスを拡張し、データをコスト効率よく管理しながらすべてのデータにアクセスできるようにします。



データレイクを用いたAutonomous Databaseの図、説明は以下の通り この図は、Hadoop、Spark、OpenSearchといったオラクルが管理するオープン・ソース・サービスを活用したデータ・プラットフォームのアーキテクチャを、データソース、核となるオラクルのオープン・ソース・サービス、そして考えられる結果で示しています。.

オラクルのデータレイク・サービス

データの移動と統合

リアルタイムで一貫性のあるトランザクション・データ、効率的なバッチ・ロード、ストリーミング・データを使用して分析アプリケーションを接続、拡張します。

  • OCI Data Integration
    コード不要のデータフロー・デザイナーを使用して、データ・サイエンスや分析用のデータレイクおよびデータウェアハウスに対する複雑なデータ抽出、変換、読み込み(ETL/E-LT)を簡素化します。
  • Oracle Data Integrator
    Data Integratorは、抽出、変換、ロードのための高度なデータ移行を行います。Oracle Data Integratorは、オラクルのクラウド・データベースおよびオンプレミス・データベース用に最適化されています。
  • Oracle GoldenGate
    Oracle GoldenGateは、高可用性を実現し、リアルタイムのデータ統合、変更データのキャプチャ、データのレプリケーション、変換、運用および分析エンタープライズ・システム間の検証を実現します。
  • OCI Streaming
    Streamingは、DevOps、データベース、ビッグデータ、SaaSアプリケーションなどのカテゴリーにまたがる数百ものサードパーティ製品との統合をすぐに行うことができます。

データレイク

低コストで労力の少ないフルマネージド・データ・サービスを使用してデータ・レイクを構築できます。

  • OCI Data Lake
    Data Lakeは、統合されたきめ細やかなアクセス制御により、構造化データおよび非構造化データの一元的なストレージとメタデータを提供します。
  • OCI Object Storage
    Object Storageでは、すべてのタイプのデータをネイティブ形式で保存できます。これは、規模と柔軟性を必要とする最新のアプリケーションの構築に最適です。
  • OCI Data Catalog
    Data Catalogは、組織のデータ専門家が企業全体のデータ資産のインベントリを使用してデータを検索、調査、管理するのに役立ちます。
  • OCI Data Flow
    Data Flowは、フルマネージドのApache Sparkサービスであり、導入または管理するインフラストラクチャなしで、非常に大規模なデータ・セットに対して処理タスクを実行します。これにより、開発者はインフラストラクチャ管理ではなくアプリ開発に集中できるため、迅速なアプリケーション配信が可能になります。
  • Oracle Big Data
    Big Data Serviceは、大量の生の顧客データを保存および分析するために使用されるHadoopベースのデータレイク・サービスです。マネージド・サービスとして、Big Data Serviceには、オープン・ソース・ツールとオラクルの付加価値ツールの両方を含む、IT運用を簡素化する完全に統合されたツール・スタックが付属しています。

データレイクハウス

データレイクとお好みのデータウェアハウスとのOCI統合を活用し、新たなインサイトを明らかにします。

  • MySQL Heatwave Lakehouse
    MySQL HeatWave Lakehouseはデータレイクに透過的に接続し、CSV、Parquet、Aurora/Redshiftバックアップなどのさまざまなファイル形式でオブジェクトストア内の数百TBのデータの処理とクエリを実行できるようにします。
  • Autonomous Databaseレイクハウスの機能
    Autonomous Databaseは、セルフサービスのデータレイクハウスを実現し、ユーザーによるすべてのオブジェクトストア(OCI、AWS、Azure、Google Cloud Platformを含む)上のファイルのロードや直接クエリを可能にします。統合された機械学習、空間分析、テキスト分析、グラフ分析により、データを移動せずにインサイトを得ることができます。

AIと機械学習

デフォルトのAIモデルを使用してデータからインサイトを獲得したり、独自のモデルを作成したりできます。

  • OCI AIサービス
    AIサービスは、開発者がアプリケーションや業務にAIを簡単に適用できるようにする、デフォルトの機械学習モデルを備えた一連のサービスです。モデルは、より正確な業績が得られるようにカスタム・トレーニングできます。
  • OCI Data Science
    チーム向けに構築されたデータ・サイエンス・サービスを使用して、機械学習モデルを迅速に構築、トレーニング、デプロイ、管理できます。
  • Oracle Databaseの機械学習
    Oracle Databaseの機械学習は、大規模なデータ探索、準備、機械学習モデリングをサポートします。
  • MySQL HeatWave AutoML
    MySQL HeatWave AutoMLには、MySQL HeatWave内で機械学習モデルを構築、トレーニング、導入、説明するために必要なすべての機能が追加費用なしで含まれています。
金融サービス
Experian、OCI上のデータレイクハウスで金融包摂を加速
マイニング
MineSenseは、OCIのレイクハウスでクエリを5倍高速化しました。
広告
Besoは、23のオンライン・ソースからのデータをさまざまなオフライン・ソースと統合してデータレイクを構築しました。将来的には100個のソースに拡張する予定です。
スポーツ・テクノロジー
オラクルのデータレイクハウスにより、Seattle Soundersは100倍以上のデータを管理できるようになり、インサイトの生成が10倍高速化され、データベース管理の負荷が軽減されました。

データレイクハウスのパートナー・エコシステム

オラクルのパートナー・ソリューションはOCI上のデータレイクハウスを活用および強化します。

  • Accentureのロゴ
  • Capgeminiのロゴ
  • Deloitteのロゴ
  • h2o.aiのロゴ
  • qubixのロゴ
  • Reply Technologyのロゴ
  • Sesame Softwareのロゴ
  • wandiscoのロゴ

Informaticaは、データウェアハウスおよびレイクハウス・ソリューションのデータ統合およびガバナンスのための推奨パートナーです。

Oracle Cloud Infrastructure上でのデータレイクの導入

すべてのリファレンス・アーキテクチャを見る
Oracle Playbookシリーズ

人材、プロセス、システム戦略の秘訣をまとめました。そして、それを皆さんにお伝えできればと考えています。

OCI上のデータレイクを使い始める

Always Free Cloud Servicesを試し、30日間の試用版を入手

オラクルは、Autonomous Data Warehouse、OCI Compute、Oracle Storageを含む一部のサービスについて時間制限のない無料枠を設けています。また、その他のクラウド・サービスをお試しいただくために300米ドル分の無料クレジットもご用意しています。詳細をご確認のうえ、今すぐ無料アカウントにご登録ください。

  • Oracle Cloud Free Tierに含まれている内容を教えてください。

    • Always Free
    • 2つのAutonomous Database、それぞれ20GB
    • コンピューティングVM
    • 100GBのブロック・ボリューム
    • 10GBのオブジェクト・ストレージ

ハンズオン・ラボで学ぶ

学ぶための最適な方法は自分で試すことです。この無料のデータレイク・ワークショップをお試しください。このワークショップでは、一般的な使用シナリオを示し、データレイクの構築に使用できるいくつかのツールについて説明します。

  • Autonomous DatabaseおよびData Catalogを使用したデータレイクへのアクセス

    このワークショップのラボでは、Oracle Autonomous DatabaseとOCI Data Catalogを使用して、Oracle Object Storageバケットで作成されたデータレイクにアクセスするために必要な手順を順を追って説明します。

    データレイク・アクセス・ラボを始める
  • Oracle Big Data Serviceを使い始める

    Big Data ServiceとOCIを使用して可用性の高いHadoopクラスタを作成および監視する方法をご紹介します。また、Oracle Cloud SQLをクラスタに追加して、ユーティリティおよびマスター・ノードにアクセスするほか、Cloudera ManagerおよびHueを使用してWebブラウザでクラスタに直接アクセスする方法についても学習します。

    データレイク・ラボを始める
  • Red Bull Racingを用いて分析と機械学習を学ぶ

    分析と機械学習機能を使用して、70年分のレース・データを解析します。何が決め手となり、予測しやすいレースがある一方で、一部のレースは目が離せないほどエキサイティングなのかを紹介します。

    データ分析ラボを始める
  • Oracle Cloud Infrastructure Anomaly Detectionを使い始める

    OCI Anomaly Detectionを使用して、カスタマイズされた機械学習モデルを作成する方法を説明します。ユーザーがアップロードしたデータを取得し、専用のアルゴリズムを使用してモデルをトレーニングし、モデルをクラウド環境にデプロイして異常を検出します。

    異常検出ラボを今すぐ始める

営業へのお問い合わせ

データレイクの詳細にご関心をお持ちの場合は、当社のエキスパートにお問い合わせください。

  • 次のような質問に回答できます。

    • オラクルでデータレイクの使用を開始する方法を教えてください。
    • データウェアハウスでは不可能で、データレイクでは可能なことは何ですか。
    • データレイクはビジネスにどのような利点がありますか。