
データ・シート:Oracle Big Data ConnectorsOracle Datasource for Apache Hadoop(旧称Oracle Table Access for Apache Hadoop)はOracle Database表をHadoopデータソース(外部表)に変換し、整合性を維持しながらHive SQL/Spark SQL問合せを直接実行したりHadoop APIで直接アクセスしたりできるようにします。代表的なユースケースは、Oracleデータベースにあるディメンション・データ(マスター・データ)とHadoopストレージにあるビッグ・データ(ファクト)を結合するというものです。
Oracle Datasource for Apache Hadoopは、述語/投影のプッシュダウンやパーティション・プルーニングを使用して問合せの実行計画を最適化します。データベース表のアクセスは、スマートかつセキュアな接続(Kerberos、SSL、Oracle Wallet)を使用して、選択された分割パターンに基づいてパラレルで実行されます。このときのアクセス数はHadoop(最大同時タスク)とOracle DBA(最大プール・サイズ)の両方で調整されます。
OutputFormatがサポートされているため、Hadoopで処理した結果をOracleデータベースに再度書き込み、通常のBIツールを使用して詳細かなデータ・マイニングを実行することができます。
