Oracle Big Data Connectors

Oracle Loader
for Hadoop

Oracle SQL Connector for HDFS

HadoopからOracle Databaseへの卓越したロード・パフォーマンス

概要

Oracle Loader for HadoopとOracle SQL Connector for HDFSを使用すると、多くのHadoopシステムからOracle Databaseへの高速なデータ・ロードが可能になります。Oracleエンジニアド・システムでは、1時間当たり最大で15 TBを、Oracle Big Data ApplianceからOracle Exadata Database Machineに送信できます。データは、データベースCPUサイクルをほとんど使用せずに、極めて効率的にロードされます。

Oracle SQL Connector for HDFSは、データをHadoopからコピーし、Oracle SQLを使用してHadoopファイルのデータへの問合せを行うために使用されます。

Oracle Loader for Hadoop

Oracle Loader for Hadoop(OLH)は、HadoopからOracle Databaseへのデータ・ロードを最適化できるMapReduceユーティリティです。Hadoopクラスタ上でデータをソートし、パーティション化し、Oracle Database形式に変換します。その後、変換したデータをデータベースにロードします。Oracle Loader for Hadoopは、Hadoopクラスタでデータの前処理を実行することにより、データベースのCPUおよびI/O使用率を軽減します。

Oracle Loader for Hadoopには、オンラインとオフラインのオプションがあります。どちらのオプションでも、ソート後に変換されたデータが、データベース内の適切なパーティションにパラレルにロードされます。

Oracle SQL Connector for Hadoop Distributed File System(Oracle SQL Connector for HDFS)

Oracle SQL Connector for HDFSは、Oracle DatabaseからHDFS上のデータに直接アクセスするための高速コネクタです。ユーザーは、Oracle SQL Connector for HDFSを使用することで、いつでも必要なときに、アプリケーションからHDFS上のデータに柔軟にアクセスし、それらのデータをインポートできます。

このコネクタは、Oracle Databaseの外部表を使用するため、HDFSに格納されたデータにSQLから直接アクセスできます。データは、Oracle Loader for Hadoopによって作成されたOracleデータ・ポンプ・ファイルやデリミタ付きファイルに格納されています。