Oracle Data Source


Oracle Big Data Connectors

Oracle Datasource
for Apache Hadoop

        データ・シート:Oracle Big Data Connectors

ホワイト・ペーパー:Oracle Datasource for Apache Hadoop(OD4H)


概要

Oracle Datasource for Apache Hadoop(旧称Oracle Table Access for Apache Hadoop)はOracle Database表をHadoopデータソース(外部表)に変換し、整合性を維持しながらHive SQL/Spark SQL問合せを直接実行したりHadoop APIで直接アクセスしたりできるようにします。代表的なユースケースは、Oracleデータベースにあるディメンション・データ(マスター・データ)とHadoopストレージにあるビッグ・データ(ファクト)を結合するというものです。

Oracle Datasource for Apache Hadoopは、述語/投影のプッシュダウンやパーティション・プルーニングを使用して問合せの実行計画を最適化します。データベース表のアクセスは、スマートかつセキュアな接続(Kerberos、SSL、Oracle Wallet)を使用して、選択された分割パターンに基づいてパラレルで実行されます。このときのアクセス数はHadoop(最大同時タスク)とOracle DBA(最大プール・サイズ)の両方で調整されます。

OutputFormatがサポートされているため、Hadoopで処理した結果をOracleデータベースに再度書き込み、通常のBIツールを使用して詳細かなデータ・マイニングを実行することができます。

 

お役立ち情報