平面文件是数据仓库项目的一种典型数据源。在本文中,您将学习创建平面文件源模块的方法。模块是项目中的存储对象,它们可以帮助您按逻辑对源和目标对象定义进行分组。源模块保存的元数据用于描述源系统,您将从这些源系统中提取数据。目标模块保存的元数据则用于描述目标数据仓库或数据集市。
平面文件源模块定义了与包含一些平面文件示例的文件夹的连接。您将学习如何使用向导将平面文件元数据导入到平面文件源模块中。除动手操作平面文件源外,您将看到一个有关 OWB 如何处理关系表数据库源的演示。
大约 20 分钟
本教程包括下列主题:
| 概述 | ||
| 前提条件 | ||
| 创建平面文件源模块 | ||
| 总结 | ||
将光标置于此图标上可以加载和查看本教程的所有屏幕截图。(警告:因为此操作会同时加载所有屏幕截图,所以在网速较慢时,响应时间可能会比较长。)
注:此外,您还可以在下列步骤中将光标放在每个单独的图标上,从而仅加载和查看与该步骤相关的屏幕截图。单击屏幕截图即可将其隐藏。
Warehouse Builder 需要元数据来描述产品中使用的源对象。为此,您要将源组织到一些称为模块的特定的元数据组中。模块引用操作系统目录或数据库架构,并可以像操作系统目录或数据库架构一样进行查看。因此必须首先创建平面文件模块,然后再导入源中的元数据。无论对于文件还是架构中的表,要完成上述目的的过程都是相似的。
本教程主要讲述了如何定义一个存储平面文件元数据的源模块。您将学习如何使用 Import Metadata Wizard 选择希望导入的平面文件,以及如何使用 Flat File Sample Wizard 检查和记录平面文件的元数据。Flat File Sample Wizard 用于存储在 Warehouse Builder 库中定义的元数据。另外,在屏幕截图和说明的帮助下,您将了解如何检查 Oracle 数据库源模块。
为了在进行操作的同时善性能并减少所分配的内存,您需要执行下列操作:
| 1. | 为了完成本教程以及其他 Oracle Warehouse Builder 教程,您需要在 VMware 中执行下列步骤以确保系统中具有足够的内存:
|
| 2. | 大约 10 分钟之后,打开一个终端窗口并执行以下命令: crs_stat 如果所有服务均已联机,则执行下列命令,否则,您需要再等待一段时间,然后再次执行上述命令,直至所有服务都已联机。 srvctl stop instance -d RACDB -i RACDB2 opmnctl stopall emctl stop dbconsole
|
在本主题中,您将学习如何创建平面文件模块,之后您会向其中添加描述平面文件源的元数据。您创建的源模块最终将保存特定于平面文件的元数据;因此,此模块将位于 Warehouse Builder Project Explorer 的 Files 节点中。
| 1. | 要登录 OWB Design Center,打开一个终端窗口并执行下列命令: cd $OWB_HOME/owb/bin/unix ./owbclient.sh 输入 owb_owner 作为口令,然后单击 OK。
|
| 2. | 您已经以 owb_owner/owb_owner 登录了 Design Center。展开 Project Explorer 面板中的 OWB_DEMO 项目。右键单击 Files 节点,然后选择 New。
此时出现 Create Module -Welcome 页面。单击 Next。
|
| 3. | 在 Create Module - Step 2 of 2:Name and Description 页面中,输入 SOURCE 作为该模块的名称。单击 Next。
|
| 4. | 在 Create Module - Step 2 of 2:Connection Information 页面中,接受默认位置 SOURCE_LOCATION1。单击 Edit。
|
| 5. | 在 Edit File System Location:SOURCE_LOCATION1 窗口中,接受默认名称 SOURCE_LOCATION1。单击 Browse。
现在,您将指定示例的地址信息。此时出现 Browse Directory 窗口。选择 /home/oracle/wkdir 或选择保存了安装脚本的驱动器和目录(其中包含源文件夹)。单击 Select。
|
| 6. | 在 Edit File System Location:SOURCE_LOCATION1 窗口中检查路径,然后单击 OK。
|
| 7. | 在 Connection Information 窗口中,确保选中了 Import after finish。选择此选项将启动 Import Metadata Wizard。单击 Next。 提示:如果未选中该复选框,则 Import Metadata Wizard 不会自动启动。要手动启动 Import Metadata Wizard,在 Project Explorer 中展开 Files,然后右键单击 SOURCE 模块并选择 Import。
|
| 8. | 在 Summary 页面中检查模块设置。单击 Finish。
此时,平面文件模块的定义已完成。在 Design Center 中,您会在 Project Explorer 的 Files 节点中看到所创建的源模块。此时 Import Metadata Wizard 自动启动。 |
创建了平面文件模块之后,您就可以将平面文件定义导入到 Warehouse Builder 中了。Import Metadata Wizard 将带您完成导入元数据对象的全部过程。每次使用 Import Metadata Wizard 从现有平面文件导入元数据时,Import Metadata Wizard 都会启动 Flat File Sample Wizard。使用 Flat File Sample Wizard 可检查并记录平面文件的元数据。
| 使用 Import Metadata Wizard | ||
| 1. | 在 Import Metadata Wizard - Step 3 of 3:Welcome 页面中,单击 Next。
|
| 2. | 在 Import Metadata Wizard - Step 3 of 3:Filter Information 页面中,接受默认选项 All Data Files,然后单击 Next。
|
| 3. | 在 Import Metadata Wizard - Step 3 of 3:Object Selection 页面中展开 /home/oracle/wkdir 节点。
此时将出现一列文件。向下滚动并按住 shift 键选择 expense_categories.csv 和 export.csv,然后单击 > 将这两个文件添加到 Selected 列表中。单击 Next。
|
| 4. | 注:在此页面中,您会看到两个前面带有红色叉号的文件定义(expense_categories_csv 和 export_csv)。红色叉号表示在 Warehouse Builder 库中没有此文件可用的元数据信息。导入之前,Warehouse Builder 需要了解这些文件的结构。通过该抽样过程,系统收集到了有关结构的信息。 在 Import Metadata Wizard - Step 3 of 3:Summary and Import 页面中,选择第一个文件 expense_categories_csv(如果尚未选择)。单击 Sample。
此时出现 Flat File Sample Wizard。 |
| 1. | Flat File Sample Wizard 将引导您完成平面文件结构的定义。在 Flat File Sample Wizard -Welcome 页面中,单击 Next。
|
| 2. | 在 Flat File Sample Wizard -Name 页面中,接受 EXPENSE_CATEGORIES_CSV 作为默认文件名。这是 Warehouse Builder 在该文件导入之后引用该文件时使用的名称。Warehouse Builder 提供了大量可用于读取数据的字符集。 接受此页面上的默认值。此文件有 2 列,分别为 Expense Type 和 Expense Categories。此向导对该平面文件的结构作出假设。该对话框的下半部分显示了 OWB 如何将几行平面文件数据导入表列的示例。单击 Next。
|
| 3. | 注:使用 Record Organization 页面可指定记录在抽样文件中的组织方式。 在 Flat File Sample Wizard -Record Organization 中,接受以回车 (<CR>) 分隔记录的默认选项。单击 Next。
|
| 4. | 注:您需要在此页面上指定文件结构的格式。系统支持固定长度的文件字符分隔文件。 提示:如果您的文件使用了其他的分隔符,您可以在 Field Delimiter 下拉框中键入该字符,然后 Warehouse Builder 就会使用您键入的分隔符。 在 Flat File Sample Wizard -File Format 页面中,接受文件格式的 Delimited 默认选项。单击 Next。
|
| 5. | 注:您可以在此页面中指定跳过的行数。对于记录类型,您可以选择单个记录或多个记录。 在 Flat File Sample Wizard - Step 4 of 5:File Layout 页面中,接受 Skip Rows 的默认值 0。Expense_categories.csv 文件是单个记录类型文件的示例。为记录类型选择 Single Record,然后单击 Next。
|
| 6. | 如果平面文件的第一个记录是标题,则可以使用第一个记录中的值作为字段名称。在 Flat File Sample Wizard -Field Properties 页面中,选择 Use the first record as the field names。 请注意,此时字段名称已经更改。 提示:注意右侧的 SQL 数据类型,通过这些数据类型,您可以根据此文件控制外部表数据类型等内容。 单击 Next。
|
| 7. | 检查为文件 expense_categories_csv 定义的规格汇总。在 Flat File Sample Wizard -Summary 页面中,单击 Finish。
此时,该向导将创建平面文件。Flat File Sample Wizard 会带您返回 Import Metadata Wizard。 |
| 8. | 在 Import Metadata Wizard - Step 3 of 3:Summary and Import 页面中,expense_categories_csv 的 Status 字段中的绿色对号表示 expense_categories_csv 已经过抽样。
现在,您将继续抽样第二个平面文件。选择 export_csv 文件(如果尚未选择),然后单击 Sample。 提示:为了节省时间,您可以在 Same As 下拉框中选择 Same As |
| 9. | 此时出现 Flat File Wizard -Welcome 页面。单击 Next。
|
| 10. | 在 Flat File Sample Wizard -Name 页面中,接受 EXPORT_CSV 作为默认文件名。这是 Warehouse Builder 在该文件导入之后引用该文件时使用的名称。 接受此页面上的默认值。此文件有 14 列。单击 Next。
|
| 11. | 注:使用 Record Organization 页面可指定记录在抽样文件中的组织方式。 在 Flat File Sample Wizard -Record Organization 中,接受以回车 (<CR>) 分隔记录的默认选项。单击 Next。
|
| 12. | 注:您需要在此页面上指定文件结构的格式。系统支持固定长度的文件和字符分隔文。 在 Flat File Sample Wizard -File Format 页面中,接受文件格式的 Delimited 默认选项。单击 Next。
|
| 13. | 注:您可以在此页面中指定跳过的行数。对于记录类型,您可以选择单个记录或多个记录。 在 Flat File Sample Wizard - Step 4 of 5:File Layout 页面中,接受 Skip Rows 的默认值 0。expense_categories.csv 文件是单个记录类型文件的示例,为记录类型选择 Single Record,然后单击 Next。
|
| 14. | 在 Flat File Sample Wizard -Field Properties 页面中,选择 Use the first record as the field names。如果平面文件的第一个记录是标题,则可以使用第一个记录中的值作为字段名称。 在 Flat File Sample Wizard -Field Properties 页面中,选择 Date 字段。 因为 Date 是保留字,所以需要将 Date 重命名为 Expense_Date。 在 type 下拉列表中选择 Date。滚动到右侧。
在 mask 列中,键入 dd-mon-yy(不带单引号)。拖动滚动条,返回左侧。
|
| 15. | 在 Flat File Sample Wizard -Field Properties 页面中,向下滚动并选择 Reimbursable_Amount_(USD) 字段。 因为 '(' 和 ')' 都是保留字符,所以将 Reimbursable_Amount_(USD) 重命名为 Reimbursable_Amount。 在 type 下拉列表中选择 Decimal External。 单击 Next。此时出现 Flat File Sample Wizard -Summary 页面。
|
| 16. | 检查为文件 EXPORT_CSV 定义的规格汇总。在 Flat File Sample Wizard -Summary 页面中,单击 Finish。
此时,该向导将创建平面文件。Flat File Sample Wizard 会带您返回 Import Metadata Wizard。 |
| 17. |
在 Import Metadata Wizard - Step 3 of 3: Summary and Import 页面中,EXPENSE_CATEGORIES_CSV 和 EXPORT_CSV 的 Status 字段中的绿色对号表示两个文件均已经过抽样。在 Import Metadata Wizard - Step 3 of 3:Summary and Import 页面中,单击 Finish。 此时导入过程开始。Import Progress 对话框显示了导入过程。
在 Project Explorer 中展开 Files -> SOURCE。您将看到刚刚抽样并导入的两个表(EXPENSE_CATEGORIES_CSV 和 EXPORT_CSV)。
在 Design Center 的工具栏中单击 Save All ( |
在本课程中,您学习了如何执行下列任务:
| 创建平面文件源模块。 文件模块定义了与包含一些平面文件示例的文件夹的连接。 |
||
| 为平面文件创建定义,您使用了: | ||
| 使用 Import Metadata Wizard 导入平面文件 |
||
| 使用 Flat File Sample Wizard 对平面文件进行抽样 | ||