利用分区执行高速数据加载和滚动窗口操作

OBE 主页 > 10gR2 单实例 > 商务智能

利用分区执行高速数据加载和滚动窗口操作

目的

在本教程中，您将了解如何使用 Oracle10g 进行高速数据加载以及如何利用 Oracle 分区进行滚动窗口操作。

所需时间

大约 2 个小时

主题

本教程包括下列主题：

	概述
	情景
	前提条件
	为销售历史模式实施模式更改
	使用外部表加载数据
	使用 SQL*Loader 与使用外部表进行简单加载和转换的比较
	利用表压缩节省磁盘空间并降低 TCO
	使用 Oracle 分区执行滚动窗口操作
	总结

查看屏幕截图

将鼠标置于此图标上以加载和查看本教程的所有屏幕截图。（警告：因为此操作会同时加载所有屏幕截图，所以网速较慢时，响应时间可能会比较长。）

注意：此外，您还可以在下列步骤中将鼠标放在每个单独的图标上，从而仅加载和查看与该步骤相关的屏幕截图。您可以单击单个屏幕截图将其隐藏。

概述

大多数情况下，向数据仓库提供数据的 OLTP（源）系统都没有直接连接到提取新数据的数据仓库系统。通常，这些 OLTP 系统以外部文件的形式发送数据馈送。而这些数据必须加载到数据仓库中（最好是并行加载）才能充分利用现有资源。

例如，由于示例公司 MyCompany 的业务需求和磁盘空间的限制，只有过去三年的数据与分析需求相关。这意味着在插入新数据时必须清除原数据或者利用 Oracle 表压缩来释放磁盘空间。这种所谓的滚动窗口操作的维护是通过 Oracle 分区完成的。

返回主题列表

前提条件

开始本教程之前，您应该：

1.	完成了教程在 Windows 上安装 Oracle 数据库 10g。
2.	下载 etl.zip 并将其解压缩到您的工作目录（即 c:\wkdir）中。

返回主题列表

案例

外部表

为了将外部文件加载到它们的数据仓库中，MyCompany 使用了 Oracle10g 外部表特性。该特性允许将外部数据（如平面文件）在数据库中显示为一个普通的数据库表。由于可以使用 SQL 访问外部表，因此您可以使用 SQL、PL/SQL 和 Java 的所有功能直接并行查询外部文件。通常，您会在提取、转换和加载 (ETL) 过程中使用外部表，将数据转换（通过 SQL）与数据加载组合到一个步骤中。对于 ETL 中很多可能的应用以及处理平面文件所在的其他数据库环境来说，外部表都是一项非常强大的功能。它是使用 SQL*Loader 的一种替代方式。

并行执行

并行执行可以显著减少大型数据库上的数据密集型操作的响应时间，这些操作通常与决策支持系统 (DSS) 和数据仓库相关。您还可以在某些类型的联机事务处理 (OLTP) 系统和混合系统上实施并行执行。简单地说，并行就是将任务分割，从而使多个进程同时执行任务，而不是在一个进程中由一个查询执行所有任务。例如，在四个进程同时处理一年中四个不同的季度，而不是由一个进程单独处理所有季度的情况下，您可以使用并行执行。

使用 Oracle 分区执行滚动窗口操作

数据仓库内部管理系统中一个非常重要的任务就是保持数据与 OLTP（源）系统中的各种更改同步。另外，从分析角度而言，数据的寿命通常很短，因此在加载新数据时必须将原数据从目标系统中清除；这种操作通常称为滚动窗口操作。您应该尽快地完成此操作，且不应涉及任何数据仓库系统的并发联机访问。

返回主题列表

为销售历史模式实施模式更改

开始执行 OBE 的任务之前，您需要对现有的 Sales History 模式实施些许改动。需要增加一些必要的附加对象，并向用户 SH 授予额外的系统权限。用于应用这些更改的 SQL 文件是 modifySH_10gR2.sql。要使用数据仓库教程的设置文件，请执行下列步骤：

启动一个 SQL*Plus 会话。选择开始 > 程序 > Oracle-OraDB10g_home > Application Development > SQL Plus。

（请注意：本教程假设您拥有 c:\wkdir 文件夹。如果没有，则需要创建此文件夹，并将 etl.zip 的内容解压缩到此文件夹中。在执行脚本时，可指定路经。）

以 SH 用户的身份登录。输入 SH 作为 User Name，并输入 SH 作为 Password。然后单击 OK。

从 SQL*Plus 会话运行 modifySH_10gR2.sql 脚本。

@c:\wkdir\modifySH_10gR2.sql

获得的输出的底部应与以下图像匹配。

返回主题列表

使用外部表加载数据

在此部分中，您将使用外部表将数据加载到数据仓库中。

为了演示如何创建和使用外部表，请执行下列步骤：

1.	创建必要的目录对象。
2.	创建外部表。
3.	从外部表中选择。
4.	为外部表提供透明的高速并行访问。
5.	查看 Oracle 的并行插入功能。
6.	执行并行插入。

返回主题列表

1. 创建必要的目录对象。

在创建外部表之前，您需要在数据库中创建一个目录对象，该对象将指向数据文件所在的文件系统上的目录。您还可以将日志、坏文件和废弃文件的位置与这些数据文件的位置分隔开。要创建该目录，执行下列步骤：

在登录到 SH 模式的 SQL*Plus 会话中，运行 create_directory.sql，或将以下 SQL 语句复制到 SQL*Plus 会话中：

@create_directory.sql

DROP DIRECTORY data_dir;
DROP DIRECTORY log_dir;
CREATE DIRECTORY data_dir AS 'c:\wkdir';
CREATE DIRECTORY log_dir AS 'c:\wkdir';

将鼠标移到该图标上可以查看该图像

这些脚本是针对 Windows 系统创建的，并且假设上机操作研习会
已经解压缩到驱动器 C:\ 上。

1.	用于在数据库中表示表的元数据信息
2.	用于从外部文件提取数据的 HOW 访问参数定义

1.	创建一个临时表。
2.	使用 SQL*Loader 将数据加载到临时表中。
3.	将临时表加载到目标数据库中。
4.	删除临时表。

1.	准备一个包含新据的独立表
2.	向事实表添加新数据
3.	从事实表中删除旧数据

1.1	修改外部表以使用 DBMS_STATS 处理第一季度销售数据。
1.2	为新的第一季度销售数据创建表。
1.3	加载该表。
1.4	为该表创建位图索引。
1.5	为该表创建约束。

2.1	如果尚不存在任何分区，则创建一个新分区。
2.2	交换该分区。这只是一个数据字典操作，不会触及任何数据。
2.3	从分区进行选择以确保成功。
2.4	分割近期的分区以确保（业务）数据完整性。

3.1	建空的独立表。
3.2	为该表创建位图索引。
3.3	为该表创建约束。
3.4	显示交换前分区中的数据。
3.5	将新的空表与现有的 Q1-1998 分区进行交换。
3.6	显示交换后分区中的数据。

1.	使用 Oracle 数据库 10g 为本地索引维护提供的性能增强
2.	使用 Oracle 的全局索引维护

1.1	使用默认放置规则分割近期的分区。
1.2	使用为本地索引维护扩展的 SQL 语法分割分区。
1.3	清理。

2.1	准备进行全局索引维护。
2.2	构建全局索引。
2.3	交换带有全局索引维护的分区，并体验它对全局索引的影响。
2.4	交换不带全局索引维护的分区，并体验它对全局索引的影响。
2.5	删除全局索引，并交换回初始状态（清理）。

	使用外部表加载数据
	比较 SQL*Loader 与外部表的使用
	执行表压缩来节省磁盘空间
	利用 Oracle 分区执行滚动窗口操作

OBE 主页 > 10gR2 单实例 > 商务智能

目的

主题

查看屏幕截图

概述

案例

外部表

并行执行

使用 Oracle 分区执行滚动窗口操作

使用外部表加载数据

1. 创建必要的目录对象。

2. 创建外部表

3. 从外部表中选择

4. 为外部表提供透明的高速并行访问

5. 查看 Oracle 的并行插入功能

6. 执行并行插入

使用 SQL*Loader 与使用外部表进行简单加载和转换的比较

1. 创建临时表

2. 使用 SQL*Loader 将数据加载到临时表中

3. 将临时表加载到目标数据库中

4. 删除临时表

利用表压缩节省磁盘空间并降低 TCO

1. 压缩近期的分区

使用 Oracle 分区执行滚动窗口操作

执行滚动窗口操作的步骤：

1. 准备一个包含新数据的独立表

1.1 修改外部表以使用 DBMS_STATS 处理第一季度销售数据

1.2 为新的第一季度销售数据创建表

1.3 加载该表

1.4 为该表创建位图索引

1.5 为该表创建约束

2. 向事实表添加新数据

2.1 创建新分区

2.2 交换分区

2.3 从分区选择

2.4 分割近期的分区以确保（业务）数据完整性

3. 从事实表中删除旧数据

3.1 创建空的独立表

3.2 为该表创建位图索引

3.3 为该创建约束

3.4 显示交换前分区中的数据

3.5 交换分区

3.6 显示交换后分区中的数据

Oracle 10g 为本地索引维护供的性能增强

1.1 分割近期的分区

1.2 使用扩展的 SQL 语法分割分区

1.3 清理

2. 使用 Oracle 的全局索引维护

2.1 准备进行全局索引维护

2.2 构建全局索引

2.3 交换带有全局索引维护的分区

2.4 交换不带全局索引维护的分区

2.5 删除全局索引并交换回初始状态

总结