OCIデータレイクは、統合されたきめ細やかなアクセス制御による、一元化された構造化データおよび非構造化データのストレージとメタデータ、およびオープン・ソース・ツールやOracle Autonomous Data Warehouseとのシームレスな統合を実現します。
OCIデータレイクではACIDトランザクションがサポートされています。OCIデータレイクでは、Delta Lake、Iceberg、Hudi などのオープン・ソースの表形式がサポートされており、オープン・アーキテクチャによる分析が容易になります。
Oracle Cloud Infrastructureは今年、OCIデータレイクと呼ばれるフルマネージドのデータレイク・サービスを開始します。早期アクセスにサインアップしていただくと、一般にリリースされる前に機能や特徴をご確認いただけます。
OCIデータレイクは、データ管理を簡素化します。OCIデータレイクは、データ統合、データ・カタログ、Apache Sparkによるデータ・フロー、Apache HadoopによるOracle Big Data、データ・サイエンス・ノートブック、Autonomous Data Warehouseなど、お客様が必要とするOCIデータ・サービスと統合されています。
セキュリティは一度定義すれば、どこでも適用可能です。OCIデータレイクのオラクル・マネージド・ストレージは、データをセキュアに保存および共有する方法を提供し、チーム全体にわたるシームレスなコラボレーションを実現します。
OCIデータレイクは多数のデータ形式をサポートしており、形式に関係なくデータを接続、取り込み、処理することができます。これにより、デルタ表の異なるバージョン間での移動が可能になります。これにより、デルタ表の異なるバージョン間での移動が容易になります。
OCIデータ統合またはOCIデータ・フロー・ジョブを使用して、さまざまなクラウド・プロバイダーやオンプレミスのデータ・ソースから、OCIでホストされているデータレイクにデータを取り込みます。このアーキテクチャは、バッチ、データ、リアルタイム、イベントベースの統合シナリオに対応しています。データがOCI Data Lakeに格納されると、OCIが管理するHadoopやSparkで処理および分析することができます。
データ・レイクのオブジェクト・ストレージ内のすべてのリソースにきめ細やかなアクセス制御を提供するOCIデータレイク・サービスをご紹介させていただきます。Oracle Identity and Access Management の管理者は、たとえば、データ・サイエンティストのグループに従業員を追加または削除すると、その従業員は自動的にグループの他のメンバーと同じアクセス権限を持つようになります。
記事全体を読むオラクルは、Autonomous Data Warehouse、OCI Compute、Oracle Storageを含む一部のサービスについて時間制限のない無料枠を設けています。また、その他のクラウド・サービスをお試しいただくために300米ドル分の無料クレジットもご用意しています。詳細をご確認のうえ、今すぐ無料アカウントにご登録ください。
学ぶための最適な方法は自分で試すことです。この無料のデータレイク・ワークショップをお試しください。このワークショップでは、一般的な使用シナリオを示し、データレイクの構築に使用できるいくつかのツールについて説明します。
このワークショップのラボでは、Oracle Autonomous DatabaseとOCI Data Catalogを使用して、Oracle Object Storageバケットで作成されたデータレイクにアクセスするために必要な手順を順を追って説明します。
データレイク・アクセス・ラボを始めるBig Data ServiceとOCIを使用して可用性の高いHadoopクラスタを作成および監視する方法をご紹介します。また、Oracle Cloud SQLをクラスタに追加して、ユーティリティおよびマスター・ノードにアクセスするほか、Cloudera ManagerおよびHueを使用してWebブラウザでクラスタに直接アクセスする方法についても学習します。
データレイク・ラボを始める分析と機械学習機能を使用して、70年分のレース・データを解析します。何が決め手となり、予測しやすいレースがある一方で、一部のレースは目が離せないほどエキサイティングなのかを紹介します。
データ分析ラボを始めるOCI Anomaly Detectionを使用して、カスタマイズされた機械学習モデルを作成する方法を説明します。ユーザーがアップロードしたデータを取得し、専用のアルゴリズムを使用してモデルをトレーニングし、モデルをクラウド環境にデプロイして異常を検出します。
異常検出ラボを今すぐ始める