データレイクとは、構造化データ、半構造化データ、非構造化データを、あらゆる形式と規模で、簡単に分析できるリポジトリのことです。Oracle Cloud Infrastructure(OCI)を使用すると、安全でコスト効率に優れ、管理が容易なデータレイクを構築することができます。OCI上のデータレイクは、お客様が希望するデータウェアハウスや分析、またデータカタログ、セキュリティ、観測サービスなど、他のOCIサービスと緊密に統合されます。
データをバッチまたはストリームでシームレスにOCIデータレイクに移動し、分析することができます。OCI Data Integration、OCI GoldenGate、または OCI Streamingを利用してデータを取り込み、OCI Object Storageに保存します。
OCI上の一元的なデータレイクは、Oracle Autonomous Data Warehouse、MySQL HeatWaveなどのデータベース、Oracle Analytics Cloudなどの分析および機械学習 (ML) ツール、Apache Sparkなどのオープン・ソース・プロジェクトなど、お好みのツールと統合できます。
AIおよびMLサービスの包括的なセットにより、データから新しいインサイトを獲得し、予測を行い、運用上のオーバーヘッドを低減し、カスタマー・エクスペリエンスを向上させることができます。
OCI Data Catalogを使用して、データをカタログ化し、データレイクに関するインサイトを収集します。クエリ・ツールやデータベースが、オブジェクト・ストア内のデータを検出し、クエリを実行できるようにします。
Oracle Cloud Infrastructureは、今年、OCI Data Lakeと呼ばれるフルマネージド・データレイク・サービスを立ち上げています。アカウント登録すると、アクセスの早い段階で、公開前にその機能を確認できます。
データレイクを利用すると、より多くの種類のデータを扱うことが可能になりますが、その分管理に時間と手間がかかることがデメリットになる可能性があります。OCIは、フルマネージドのオープン・ソース・データレイク・サービスを提供することでコストと管理負荷の両方が低減されるため、運用コストの削減、スケーラビリティとセキュリティの向上、そして既存のデータをすべて1か所に組み込むことの実現が期待できます。
データウェアハウスとデータ・マートは、ビジネスの成功に不可欠です。データレイクとの統合により、その価値はさらに高まります。データベース、データウェアハウス、データレイクをオラクルで統合することで、1つのSQLクエリで複数の場所からデータにアクセスすることができます。現在のアプリケーションやツールですべてのデータに透過的にアクセスでき、変更や新しいスキルの習得は不要です。
エンタープライズ・アプリケーションで生成されるデータには大きな価値がありますが、十分に利用されることはほとんどありません。OCI上のデータレイクは、複数のアプリケーションやデータソースからのデータへのアクセスを簡素化し、四半期の好調と不調の分かれ目となる可能性がある高度な分析を可能にします。
組込みのOCIデータ統合エクスペリエンスでデータを一元化します。
レプリケーションなしで、どのようなソースからでも、あらゆるデータに対してクエリを実行します。
価値実現を即時にかなえる事前統合されたアプリケーション
組込みのOCIデータ・カタログ・エクスペリエンスを用い、カタログ化と管理を行います。
きめ細かい役割ベースのアクセス制御ポリシーで、データを保護します。
Oracle Autonomous Databaseは、Oracle Cloud Infrastructureだけでなく、Amazon Web Services(AWS)、Microsoft Azure、Google Cloudなどでのデータレイクとの統合もサポートしています。データベースにデータをロードするか、ソース・オブジェクト・ストアにあるデータを直接問合わせるかという選択肢があります。.どちらのアプローチも、データへのアクセスには同じツールやAPIを使用します。
このアーキテクチャは、レイクハウス・アーキテクチャと呼ばれることもあります。
1つのMySQLクラウド・データベース・サービスで、トランザクション、データウェアハウスやデータレイクを横断したリアルタイム分析、機械学習を、ETLの重複による複雑さ、レイテンシ、リスク、コストなしに実現します。
* 公開ベンチマークはこちらからご覧いただけます。
HadoopベースまたはSparkベースのデータレイクをすばやく作成してデータウェアハウスを拡張し、データをコスト効率よく管理しながらすべてのデータにアクセスできるようにします。
リアルタイムで一貫性のあるトランザクション・データ、効率的なバッチ・ロード、ストリーミング・データを使用して分析アプリケーションを接続、拡張します。
低コストで労力の少ないフルマネージド・データ・サービスを使用してデータ・レイクを構築できます。
データレイクとお好みのデータウェアハウスとのOCI統合を活用し、新たなインサイトを明らかにします。
デフォルトのAIモデルを使用してデータからインサイトを獲得したり、独自のモデルを作成したりできます。
オラクルのパートナー・ソリューションはOCI上のデータレイクハウスを活用および強化します。
オラクルは、Autonomous Data Warehouse、OCI Compute、Oracle Storageを含む一部のサービスについて時間制限のない無料枠を設けています。また、その他のクラウド・サービスをお試しいただくために300米ドル分の無料クレジットもご用意しています。詳細をご確認のうえ、今すぐ無料アカウントにご登録ください。
学ぶための最適な方法は自分で試すことです。この無料のデータレイク・ワークショップをお試しください。このワークショップでは、一般的な使用シナリオを示し、データレイクの構築に使用できるいくつかのツールについて説明します。
このワークショップのラボでは、Oracle Autonomous DatabaseとOCI Data Catalogを使用して、Oracle Object Storageバケットで作成されたデータレイクにアクセスするために必要な手順を順を追って説明します。
データレイク・アクセス・ラボを始めるBig Data ServiceとOCIを使用して可用性の高いHadoopクラスタを作成および監視する方法をご紹介します。また、Oracle Cloud SQLをクラスタに追加して、ユーティリティおよびマスター・ノードにアクセスするほか、Cloudera ManagerおよびHueを使用してWebブラウザでクラスタに直接アクセスする方法についても学習します。
データレイク・ラボを始める分析と機械学習機能を使用して、70年分のレース・データを解析します。何が決め手となり、予測しやすいレースがある一方で、一部のレースは目が離せないほどエキサイティングなのかを紹介します。
データ分析ラボを始めるOCI Anomaly Detectionを使用して、カスタマイズされた機械学習モデルを作成する方法を説明します。ユーザーがアップロードしたデータを取得し、専用のアルゴリズムを使用してモデルをトレーニングし、モデルをクラウド環境にデプロイして異常を検出します。
異常検出ラボを今すぐ始める