OBE 主页 > 10gR2 VMware > 使用平面文件事务数据

使用平面文件事务数据

平面文件是数据仓库项目的一种典型数据源。在本文中,您将学习创建平面文件源模块的方法。模块是项目中的存储对象,它们可以帮助您按逻辑对源和目标对象定义进行分组。源模块保存的元数据用于描述源系统,您将从这些源系统中提取数据。目标模块保存的元数据则用于描述目标数据仓库或数据集市。

平面文件源模块定义了与包含一些平面文件示例的文件夹的连接。您将学习如何使用向导将平面文件元数据导入到平面文件源模块中。除动手操作平面文件源外,您将看到一个有关 OWB 如何处理关系表数据库源的演示。

大约 20 分钟

主题

本教程包括下列主题:

创建平面文件源模块

导入平面文件元数据

将光标置于此图标上可以加载和查看本教程的所有屏幕截图。(警告:因为此操作会同时加载所有屏幕截图,所以在网速较慢时,响应时间可能会比较长。)

注:此外,您还可以在下列步骤中将光标放在每个单独的图标上,从而仅加载和查看与该步骤相关的屏幕截图。单击屏幕截图即可将其隐藏。

概述

Warehouse Builder 需要元数据来描述产品中使用的源对象。为此,您要将源组织到一些称为模块的特定的元数据组中。模块引用操作系统目录或数据库架构,并可以像操作系统目录或数据库架构一样进行查看。因此必须首先创建平面文件模块,然后再导入源中的元数据。无论对于文件还是架构中的表,要完成上述目的的过程都是相似的。

本教程主要讲述了如何定义一个存储平面文件元数据的源模块。您将学习如何使用 Import Metadata Wizard 选择希望导入的平面文件,以及如何使用 Flat File Sample Wizard 检查和记录平面文件的元数据。Flat File Sample Wizard 用于存储在 Warehouse Builder 库中定义的元数据。另外,在屏幕截图和说明的帮助下,您将了解如何检查 Oracle 数据库源模块。

返回主题列表

为了在进行操作的同时善性能并减少所分配的内存,您需要执行下列操作:

1.

为了完成本教程以及其他 Oracle Warehouse Builder 教程,您需要在 VMware 中执行下列步骤以确保系统中具有足够的内存:

  1. 单击 VMware Workstation 工具栏中的 Revert to parent snapshot
  2. 选择 VM > Settings
  3. 将内存从 720MB 更改为 800MB。并单击 OK
  4. 然后单击 Start this Virtual Machine


2.

大约 10 分钟之后,打开一个终端窗口并执行以下命令:

crs_stat

如果所有服务均已联机,则执行下列命令,否则,您需要再等待一段时间,然后再次执行上述命令,直至所有服务都已联机。

srvctl stop instance -d RACDB -i RACDB2
opmnctl stopall
emctl stop dbconsole

将鼠标移到该图标上可以查看图像


返回主题列表

在本主题中,您将学习如何创建平面文件模块,之后您会向其中添加描述平面文件源的元数据。您创建的源模块最终将保存特定于平面文件的元数据;因此,此模块将位于 Warehouse Builder Project Explorer 的 Files 节点中。

1.

要登录 OWB Design Center,打开一个终端窗口并执行下列命令:

cd $OWB_HOME/owb/bin/unix
./owbclient.sh 

输入 owb_owner 作为口令,然后单击 OK

将鼠标移到该图标上可以查看图像

2.

您已经以 owb_owner/owb_owner 登录了 Design Center。展开 Project Explorer 面板中的 OWB_DEMO 项目。右键单击 Files 节点,然后选择 New

将鼠标移到该图标上可以查看图像

此时出现 Create Module -Welcome 页面。单击 Next

将鼠标移到该图标上可以查看图像

3.

在 Create Module - Step 2 of 2:Name and Description 页面中,输入 SOURCE 作为该模块的名称。单击 Next

将鼠标移到该图标上可以查看图像

4.

在 Create Module - Step 2 of 2:Connection Information 页面中,接受默认位置 SOURCE_LOCATION1。单击 Edit

将鼠标移到该图标上可以查看图像

5.

在 Edit File System Location:SOURCE_LOCATION1 窗口中,接受默认名称 SOURCE_LOCATION1。单击 Browse

将鼠标移到该图标上可以查看图像

现在,您将指定示例的地址信息。此时出现 Browse Directory 窗口。选择 /home/oracle/wkdir 或选择保存了安装脚本的驱动器和目录(其中包含源文件夹)。单击 Select

将鼠标移到该图标上可以查看图像

6.

在 Edit File System Location:SOURCE_LOCATION1 窗口中检查路径,然后单击 OK

将鼠标移到该图标上可以查看图像

7.

在 Connection Information 窗口中,确保选中了 Import after finish。选择此选项将启动 Import Metadata Wizard。单击 Next

提示:如果未选中该复选框,则 Import Metadata Wizard 不会自动启动。要手动启动 Import Metadata Wizard,在 Project Explorer 中展开 Files,然后右键单击 SOURCE 模块并选择 Import

将鼠标移到该图标上可以查看图像

8.

在 Summary 页面中检查模块设置。单击 Finish

将鼠标移到该图标上可以查看图像

此时,平面文件模块的定义已完成。在 Design Center 中,您会在 Project Explorer 的 Files 节点中看到所创建的源模块。此时 Import Metadata Wizard 自动启动。

返回主题列表

导入平面文件元数据

创建了平面文件模块之后,您就可以将平面文件定义导入到 Warehouse Builder 中了。Import Metadata Wizard 将带您完成导入元数据对象的全部过程。每次使用 Import Metadata Wizard 从现有平面文件导入元数据时,Import Metadata Wizard 都会启动 Flat File Sample Wizard。使用 Flat File Sample Wizard 可检查并记录平面文件的元数据。

使用 Import Metadata Wizard

使用 Flat File Sample Wizard

返回主题列表

使用 Import Metadata Wizard

1.

在 Import Metadata Wizard - Step 3 of 3:Welcome 页面中,单击 Next

将鼠标移到该图标上可以查看图像

2.

在 Import Metadata Wizard - Step 3 of 3:Filter Information 页面中,接受默认选项 All Data Files,然后单击 Next

将鼠标移到该图标上可以查看图像

3.

在 Import Metadata Wizard - Step 3 of 3:Object Selection 页面中展开 /home/oracle/wkdir 节点。

将鼠标移到该图标上可以查看图像

此时将出现一列文件。向下滚动并按住 shift 键选择 expense_categories.csvexport.csv,然后单击 > 将这两个文件添加到 Selected 列表中。单击 Next

将鼠标移到该图标上可以查看图像

4.

注:在此页面中,您会看到两个前面带有红色叉号的文件定义(expense_categories_csv 和 export_csv)。红色叉号表示在 Warehouse Builder 库中没有此文件可用的元数据信息。导入之前,Warehouse Builder 需要了解这些文件的结构。通过该抽样过程,系统收集到了有关结构的信息。

在 Import Metadata Wizard - Step 3 of 3:Summary and Import 页面中,选择第一个文件 expense_categories_csv(如果尚未选择)。单击 Sample

将鼠标移到该图标上可以查看图像

此时出现 Flat File Sample Wizard。

返回主题

使用 Flat File Sample Wizard

1.

Flat File Sample Wizard 将引导您完成平面文件结构的定义。在 Flat File Sample Wizard -Welcome 页面中,单击 Next

将鼠标移到该图标上可以查看图像

2.

在 Flat File Sample Wizard -Name 页面中,接受 EXPENSE_CATEGORIES_CSV 作为默认文件名。这是 Warehouse Builder 在该文件导入之后引用该文件时使用的名称。Warehouse Builder 提供了大量可用于读取数据的字符集。

接受此页面上的默认值。此文件有 2 列,分别为 Expense Type 和 Expense Categories。此向导对该平面文件的结构作出假设。该对话框的下半部分显示了 OWB 如何将几行平面文件数据导入表列的示例。单击 Next

将鼠标移到该图标上可以查看图像

3.

注:使用 Record Organization 页面可指定记录在抽样文件中的组织方式。

在 Flat File Sample Wizard -Record Organization 中,接受以回车 (<CR>) 分隔记录的默认选项。单击 Next

将鼠标移到该图标上可以查看图像

4.

注:您需要在此页面上指定文件结构的格式。系统支持固定长度的文件字符分隔文件。

提示:如果您的文件使用了其他的分隔符,您可以在 Field Delimiter 下拉框中键入该字符,然后 Warehouse Builder 就会使用您键入的分隔符。

在 Flat File Sample Wizard -File Format 页面中,接受文件格式的 Delimited 默认选项。单击 Next

将鼠标移到该图标上可以查看图像

5.

注:您可以在此页面中指定跳过的行数。对于记录类型,您可以选择单个记录或多个记录。

在 Flat File Sample Wizard - Step 4 of 5:File Layout 页面中,接受 Skip Rows 的默认值 0。Expense_categories.csv 文件是单个记录类型文件的示例。为记录类型选择 Single Record,然后单击 Next

将鼠标移到该图标上可以查看图像

6.

如果平面文件的第一个记录是标题,则可以使用第一个记录中的值作为字段名称。在 Flat File Sample Wizard -Field Properties 页面中,选择 Use the first record as the field names

请注意,此时字段名称已经更改。

提示:注意右侧的 SQL 数据类型,通过这些数据类型,您可以根据此文件控制外部表数据类型等内容。

单击 Next

将鼠标移到该图标上可以查看图像

7.

检查为文件 expense_categories_csv 定义的规格汇总。在 Flat File Sample Wizard -Summary 页面中,单击 Finish

将鼠标移到该图标上可以查看图像

此时,该向导将创建平面文件。Flat File Sample Wizard 会带您返回 Import Metadata Wizard。

8.

在 Import Metadata Wizard - Step 3 of 3:Summary and Import 页面中,expense_categories_csv 的 Status 字段中的绿色对号表示 expense_categories_csv 已经过抽样。

将鼠标移到该图标上可以查看图像

现在,您将继续抽样第二个平面文件。选择 export_csv 文件(如果尚未选择),然后单击 Sample

提示:为了节省时间,您可以在 Same As 下拉框中选择 Same As 。(当要抽样的文件的结构与前面抽样过的任何一个文件相似时,则必须使用 Same As 选项)。在此示例中,要抽样的两个文件的结构不相似。

9.

此时出现 Flat File Wizard -Welcome 页面。单击 Next

将鼠标移到该图标上可以查看图像

10.

在 Flat File Sample Wizard -Name 页面中,接受 EXPORT_CSV 作为默认文件名。这是 Warehouse Builder 在该文件导入之后引用该文件时使用的名称。

接受此页面上的默认值。此文件有 14 列。单击 Next

将鼠标移到该图标上可以查看图像

11.

注:使用 Record Organization 页面可指定记录在抽样文件中的组织方式。

在 Flat File Sample Wizard -Record Organization 中,接受以回车 (<CR>) 分隔记录的默认选项。单击 Next

将鼠标移到该图标上可以查看图像

12.

注:您需要在此页面上指定文件结构的格式。系统支持固定长度的文件和字符分隔文。

在 Flat File Sample Wizard -File Format 页面中,接受文件格式的 Delimited 默认选项。单击 Next

将鼠标移到该图标上可以查看图像

13.

注:您可以在此页面中指定跳过的行数。对于记录类型,您可以选择单个记录或多个记录。

在 Flat File Sample Wizard - Step 4 of 5:File Layout 页面中,接受 Skip Rows 的默认值 0。expense_categories.csv 文件是单个记录类型文件的示例,为记录类型选择 Single Record,然后单击 Next

将鼠标移到该图标上可以查看图像

14.

在 Flat File Sample Wizard -Field Properties 页面中,选择 Use the first record as the field names。如果平面文件的第一个记录是标题,则可以使用第一个记录中的值作为字段名称。

在 Flat File Sample Wizard -Field Properties 页面中,选择 Date 字段。

因为 Date 是保留字,所以需要将 Date 重命名为 Expense_Date

在 type 下拉列表中选择 Date。滚动到右侧。

将鼠标移到该图标上可以查看图像

在 mask 列中,键入 dd-mon-yy(不带单引号)。拖动滚动条,返回左侧。

将鼠标移到该图标上可以查看图像

15.

在 Flat File Sample Wizard -Field Properties 页面中,向下滚动并选择 Reimbursable_Amount_(USD) 字段。

因为 '(' 和 ')' 都是保留字符,所以将 Reimbursable_Amount_(USD) 重命名为 Reimbursable_Amount

在 type 下拉列表中选择 Decimal External

单击 Next。此时出现 Flat File Sample Wizard -Summary 页面。

将鼠标移到该图标上可以查看图像

16.

检查为文件 EXPORT_CSV 定义的规格汇总。在 Flat File Sample Wizard -Summary 页面中,单击 Finish

将鼠标移到该图标上可以查看图像

此时,该向导将创建平面文件。Flat File Sample Wizard 会带您返回 Import Metadata Wizard。

17.

在 Import Metadata Wizard - Step 3 of 3: Summary and Import 页面中,EXPENSE_CATEGORIES_CSV 和 EXPORT_CSV 的 Status 字段中的绿色对号表示两个文件均已经过抽样。在 Import Metadata Wizard - Step 3 of 3:Summary and Import 页面中,单击 Finish

此时导入过程开始。Import Progress 对话框显示了导入过程。

将鼠标移到该图标上可以查看图像

在 Project Explorer 中展开 Files -> SOURCE。您将看到刚刚抽样并导入的两个表(EXPENSE_CATEGORIES_CSV 和 EXPORT_CSV)。

将鼠标移到该图标上可以查看图像

在 Design Center 的工具栏中单击 Save All () 提交您的工作。然后单击 Yes 保存元数据更改。

返回主题

在本课程中,您学习了如何执行下列任务:

创建平面文件源模块。 文件模块定义了与包含一些平面文件示例的文件夹的连接。

为平面文件创建定义,您使用了:

使用 Import Metadata Wizard 导入平面文件

使用 Flat File Sample Wizard 对平面文件进行抽样

返回主题列表