Oracle Big Data Serviceは、費用対効果の高いHadoop環境を提供するフルマネージドの自動化されたクラウド・サービスです。これを利用すると、大量のデータを迅速に処理できる安全でスケーラブルなHadoopベースのデータレイクを簡単に作成できます。
Oracle Big Data Serviceを使用すると、1 OCPUから専用のベアメタル環境まで幅広く用意されたVMシェイプを使用して、あらゆるサイズのHadoopクラスターを簡単にデプロイできます。ストレージは高性能のNVMeストレージと費用対効果の高いブロック・ストレージのどちらかを選択でき、クラスターを拡大または縮小することが可能です。
Oracle Big Data Serviceでは、可用性が高くセキュリティに優れたHadoopクラスターを簡単に作成できます。オラクルのベスト・プラクティスに基づく高可用性とセキュリティをワンクリックで実装できるので、Hadoopの詳しいスキルは必要ありません。
Oracle Cloud SQLは、アドオン・サービスで、HDFS、Kafka、Oracle Cloud Infrastructure Object Storage内のデータに対し、Oracle SQLクエリを発行できるようになります。すべてのユーザー、アプリケーション、分析ツールがプッシュダウンのスケールアウト処理を使用して、これらのデータストアを透過的に操作できるため、データの移動が最小限に抑えられ、クエリが高速になります。
Oracle Machine Learning for SparkRは、データサイエンティストに、Apache Hadoop分散ファイルシステム(HDFS)、Spark DataFrames、およびその他のJava Database Connectivity(JDBC)ソースに格納されているデータを操作する機能を提供します。また、スケーラブルで並列化されたアルゴリズムを含む高性能ライブラリを使用して、Apache Sparkで簡単にデプロイできる機械学習モデルをRで構築することもできます。Oracle Machine Learning for SparkRを使用すると、ユーザーはすべてのOracle Big Data Serviceクラスタノードを利用でき、付属のノートブックまたは顧客がインストールしたノートブックから簡単にアクセスできるようになります。
Oracle Big Data Serviceは、データ統合、データ・サイエンス、分析サービスと相互運用できます。そのため、使いやすくて管理が容易であるだけでなく、開発者がOracle SQLを使用して簡単にデータにアクセスできるという利点もあります。企業はデータサイロを排除し、データレイクが他の企業データソースから切り離されないようにすることができます。
Hadoopベースのデータレイクをすばやく作成して顧客のデータウェアハウスを拡張または補完し、データをコスト効率よく管理しながらすべてのデータに簡単にアクセスできるようにします。
データ・サイエンティストがR、Python、SQLをサポートする付属のノートブックからデータをクエリ、視覚化、変換してMLモデルを構築できるようにします。
お客様が自ら管理しているHadoopクラスターをフルマネージドのクラウドベース・サービスに移動することで、管理コストを削減してリソース使用率を向上させます。
製品 |
単価 |
課金単位 |
OCI - Compute - Standard |
1 vCPUにつき、1時間あたり |
|
OCI - Compute - Dense I/O |
1 vCPUにつき、1時間あたり |
|
OCI - コンピュート - HPC |
1 vCPUにつき、1時間あたり |
|
Oracle Cloud SQL |
1 vCPUにつき、1時間あたり |
|
Oracle Big Data Service - サービス料 |
1 vCPUにつき、1時間あたり |
一般的なクラウド業界の慣行では、各インスタンスに含まれる仮想CPU(vCPU)の数に基づいてコンピュート・インスタンスを定義します。各vCPUは、1スレッドの実行のための容量を提供します。vCPUは、物理コンピュートコア全体を提供するのではなく、コアの一部です。対照的に、Oracleのx86コンピュートシェイプは、物理CPUコアと同等のOCPUを使用し、それぞれが2つのスレッドを提供します。お客様がクラウド・サービス・プロバイダー間で比較しやすくするために、オラクルはWebページにvCPUの価格を表示し、請求はお客様が消費するOCPU時間の数に基づいています。お客様が請求される1時間あたりのOCPU料金は、Webページ上のvCPU価格の2倍となります。これは、お客様が1つではなく2つのvCPUの計算能力を得られるためです。
フルマネージドのHadoopクラスターをセットアップして使用する方法を学ぶことができます。