Using High-Speed Data Loading and Rolling Window Operations with Partitioning

高速データ・ロードおよびOracle Partitioningによるローリング・ウィンドウ操作

目的

このチュートリアルでは、Oracle Databaseを使用した高速データ・ロードとOracle Partitioningを使用したローリング・ウィンドウ操作について学習します。

所要時間

約2時間

トピック

このチュートリアルでは、以下のトピックについて説明します。

	概要
	シナリオ
	前提条件
	売上履歴スキーマのスキーマ変更の実装
	外部表を使用したデータ・ロード
	外部表のロードおよび変換プロセスとSQL*Loaderの比較
	表圧縮を活用したディスク領域の節約とTCOの削減
	Oracle Partitioningによるローリング・ウィンドウ操作の実行
	まとめ

スクリーンショットの表示

このアイコンの上にカーソルを置くと、すべてのスクリーンショットがロードし、表示されます。（警告：すべてのスクリーンショットが同時にロードされるため、ご使用のインターネット接続によってはレスポンス・タイムが遅くなる場合があります。）

注：各手順に関連したスクリーンショットのみを表示する場合は、それぞれの手順にあるアイコンの上にカーソルを置いてください。スクリーンショットをクリックすると、非表示になります。

概要

データウェアハウスにデータを提供するオンライン・トランザクション処理（OLTP）ソース・システムは、多くの場合、データウェアハウス・システムに直接接続して新しいデータを抽出することはありません。 OLTPシステムは一般的に、外部ファイルの形式でデータ・フィードを送信します。このデータをデータウェアハウスにロードする必要があります（なるべくパラレル処理にします）。このように、既存のリソースが活用されます。

たとえば、このチュートリアルで使用されるサンプルの企業（MyCompany）のビジネス・ニーズとディスク領域の制約によって、過去3年分のデータのみが分析に関連するとします。つまり、新しいデータを挿入する場合、古いデータを消去するか、またはOracle Databaseの表圧縮を使用して、ディスク領域を解放する必要があります。ローリング・ウィンドウと呼ばれるこのメンテナンス処理は、Oracle Partitioningによって実行されます。

トピック・リストに戻る

前提条件

このチュートリアルを始める前に次のことを確認してください。

1.	Oracle Database、SQL、PL/SQLに関する実用的な知識を有していること。
2.	データウェアハウスに精通していること。
3.	Oracle Database 11gがインストールされていること。
4.	wkdirという名前のディレクトリを作成し、このディレクトリにetl.zipをダウンロードして解凍していること。

トピック・リストに戻る

シナリオ

外部表

外部ファイルをデータウェアハウスにロードする際、MyCompanyではOracle Database外部表機能が使用されます。この機能を使用すると、フラット・ファイルなどの外部データを、通常のデータベース表と同じようにデータベース内に公開できます。外部表には、SQLを使用してアクセスできます。したがって、SQL、PL/SQL、およびJavaのすべての機能を使用して、外部ファイルに対する直接問合せをパラレルで実行できます。一般的に、外部表は、抽出、変換、およびロード（ETL）プロセスで使用され、SQLを使用したデータ変換とデータ・ロードを単一の手順に統合します。外部表は、ETLで使用される多数のアプリケーションや、フラット・ファイルを処理できるその他のデータベース環境において、非常に強力な機能です。また、SQL*Loaderの代替機能としても使用できます。

パラレル実行

パラレル実行を利用すると、意思決定支援システム（DSS）やデータウェアハウスで一般的に使用されている大規模データベースのデータ集約型処理にかかる応答時間が大幅に短縮されます。パラレル実行は、特定のOLTPシステムやハイブリッド・システムでも実装できます。簡潔に説明すると、パラレル処理とは、問合せのすべての作業を1つのプロセスで実行する代わりに、タスクを分割して、作業の各部分を多数のプロセスで同時に実行するという概念です。たとえば、パラレル実行を使用すると、1つのプロセスで4つの四半期を処理する代わりに、4つのプロセスで1つずつの四半期を処理できます。

Oracle Partitioningを使用したローリング・ウィンドウ操作

データウェアハウスに対する非常に重要なバックオフィス・タスクの1つに、OLTP（ソース）システムで行われる各種の変更に対するデータの同期があります。また、分析の観点から見たデータの使用期間は、一般的に非常に制限されています。このため、新しいデータをロードするには、古いデータをターゲット・システムから消去する必要があります。この操作は、一般的にローリング・ウィンドウ操作と呼ばれます。理想的には、データウェアハウス・システムの同時オンライン・アクセスに影響を与えることなく、この操作をできるだけ迅速に実行する必要があります。

トピック・リストに戻る

売上履歴スキーマのスキーマ変更の実装

このOracle by Example（OBE）のタスクを開始する前に、既存の売上履歴（SH）スキーマに変更を実装する必要があります。 SHスキーマに追加のオブジェクトを作成します。また、追加のシステム権限をSHユーザーに付与する必要があります。これらの変更を行うSQLファイルは、modifySH_11g.sqlです。次の手順を実行してください。

ターミナル・ウィンドウを開きます。ターミナル・セッションから次のコマンドを実行して、作業ディレクトリを/home/oracle/wkdir/etlに変更します。

cd wkdir/etl

（注：このチュートリアルでは、/home/oracle/wkdir/etlフォルダが作成されていることを前提とします。このフォルダが作成されていない場合は、フォルダを作成し、etl.zipの内容をこのフォルダに解凍する必要があります。）

SQL*Plusセッションを開始し、SHユーザーとしてログインします（パスワードにSHを使用します）。

次のmodifySH_11g.sqlスクリプトをSQL*Plusセッションで実行します。

@modifySH_11g.sql

出力結果の末尾が、下に示すイメージと一致している必要があります。

トピック・リストに戻る

外部表を使用したデータ・ロード

ここでは、外部表を使用してデータウェアハウスにデータをロードします。

外部表を構築して使用するには、以下の手順を実行します。

1.	必要なディレクトリ・オブジェクトの作成
2.	外部表の作成
3.	外部表からの選択
4.	外部表への透過的な高速パラレル・アクセスの提供
5.	Oracleのパラレル挿入機能の確認
6.	パラレル挿入の実行

トピック・リストに戻る

1. 必要なディレクトリ・オブジェクトの作成

外部表を作成する前に、データファイルが存在するファイル・システムのディレクトリを示すデータベースのディレクトリ・オブジェクトを作成する必要があります。任意で、データファイルのロケーションと、log、bad、およびdiscardファイルのロケーションを分離できます。ディレクトリを作成するには、以下の手順を実行します。

SHユーザーとしてログオンしたSQL*Plusセッションで、create_directory.sqlスクリプトを実行するか、以下のSQL文をSQL*Plusセッションにコピーします。

DROP DIRECTORY data_dir;
DROP DIRECTORY log_dir;
CREATE DIRECTORY data_dir AS '/home/oracle/wkdir/etl';
CREATE DIRECTORY log_dir AS '/home/oracle/wkdir/etl';

このアイコンの上にカーソルを置くと、イメージが表示されます。

スクリプトはLinuxシステム用に設定されており、ファイルが/home/oracle/wkdir/etlに抽出されたと仮定します。セキュリティ上の理由から、シンボリック・リンクはデータベース内のDIRECTORYオブジェクトとしてサポートされていません。

1.	データベース内の表を表現するメタデータ情報
2.	外部ファイルからデータを抽出するHOWアクセス・パラメータ定義

1.	ステージング表の作成
2.	SQL*Loaderによるステージング表へのデータのロード
3.	ターゲット・データベースへのステージング表のロード
4.	ステージング表の削除

1.	新しいデータを使用したスタンドアロン表の準備
2.	ファクト表への新しいデータの追加
3.	ファクト表からの古いデータの削除

1.1	第1四半期の売上データを使用するための外部表の変更
1.2	新しい第1四半期の売上データ表の作成
1.3	この表のロード
1.4	この表のビットマップ索引の作成
1.5	この表の制約の作成

2.1	新しいパーティションの作成（パーティションが作成されていない場合）
2.2	パーティションの交換（データ・ディクショナリ操作のみでデータは操作しません）.
2.3	パーティションからの選択による妥当性の管理
2.4	最新のパーティションの分割による（ビジネス）データ整合性の確保

3.1	空のスタンドアロン表の作成
3.2	この表のビットマップ索引の作成
3.3	この表の制約の作成
3.4	交換前のパーティションのデータ表示
3.5	空の新しい表と既存の1998年第1四半期のパーティションの交換
3.6	交換後のパーティションのデータ表示

1.	Oracle Database 10gの拡張機能を使用したローカル索引メンテナンス
2.	Oracleのグローバル索引メンテナンスの利用

1.1	デフォルトの配置ルールを使用した最新のパーティションの分割
1.2	ローカル索引メンテナンス用の拡張SQL構文を使用したパーティションの分割
1.3	クリーンアップ

2.1	グローバル索引メンテナンスの準備
2.2	グローバル索引の構築
2.3	グローバル索引メンテナンスを使用したパーティションの交換とグローバル索引への影響
2.4	グローバル索引メンテナンスを使用しないパーティションの交換とグローバル索引への影響
2.5	グローバル索引の削除と交換（クリーンアップ）

	外部表を使用したデータ・ロード
	SQL*Loaderの使用と外部表との比較
	表圧縮によるディスク領域の節約
	Oracle Partitioningによるローリング・ウィンドウ操作の実行

目的

トピック

スクリーンショットの表示

概要

シナリオ

外部表

パラレル実行

Oracle Partitioningを使用したローリング・ウィンドウ操作

外部表を使用したデータ・ロード

1. 必要なディレクトリ・オブジェクトの作成

2. 外部表の作成

3. 外部表からの選択

4. 外部表への透過的な高速パラレル・アクセスの提供

5. Oracleのパラレル挿入機能の確認

6. パラレル挿入の実行

外部表のロードおよび変換プロセスとSQL*Loaderの比較

1. ステージング表の作成

2. SQL*Loaderによるステージング表へのデータのロード

3. ターゲット・データベースへのステージング表のロード

4. ステージング表の削除

表圧縮を活用したディスク領域の節約とTCOの削減

1. 最新のパーティションの圧縮

Oracle Partitioningによるローリング・ウィンドウ操作の実行

ローリング・ウィンドウ操作の手順の実行

1. 新しいデータを使用したスタンドアロン表の準備

1.1 第1四半期の売上データを使用するための外部表の変更

1.2 新しい第1四半期の売上データ表の作成

1.3 この表のロード

1.4 この表のビットマップ索引の作成

1.5 この表の制約の作成

2. ファクト表への新しいデータの追加

2.1 新しいパーティションの作成

2.2 パーティションの交換

2.3 パーティションからの選択

2.4 最新のパーティションの分割による（ビジネス）データ整合性の確保

3. ファクト表からの古いデータの削除

3.1 空のスタンドアロン表の作成

3.2 この表のビットマップ索引の作成

3.3 この表の制約の作成

3.4 交換前のパーティションのデータ表示

3.5 パーティションの交換

3.6 交換後のパーティションのデータ表示

Oracle Database 10gの拡張機能を使用したローカル索引メンテナンス

1.1 最新のパーティションの分割

1.2 拡張SQL構文を使用したパーティションの分割

1.3 クリーンアップ

2. Oracleのグローバル索引メンテナンスの利用

2.1 グローバル索引メンテナンスの準備

2.2 グローバル索引の構築

2.3 グローバル索引メンテナンスを使用したパーティションの交換

2.4 グローバル索引メンテナンスを使用しないパーティションの交換

2.5 グローバル索引の削除と交換

まとめ