Oracle Analytics 平台功能浏览器

数据模型

数据建模是指以某种格式表示数据,帮助业务用户轻松了解问题和查找问题答案的过程。它需要一种集中式方法来确保企业度量一致,还需要一种自助方法来帮助业务用户混合数据,满足数据调查要求。

数据建模

数据建模对于提供现成可用的数据来回答大多数常规业务问题和跨所有企业数据构建统一的数据视图至关重要。同时,数据模型还可以忽略数据物理存储方式的复杂性,为业务用户提供有意义的数据视图。例如,财务用户无需学习 SQL 或 MDX 查询语言就可以使用自己常用的可识别财务术语,轻松查询关系数据库管理系统 (RDBMS) 或 Essbase 多维数据集。

数据模型可统一定义企业业务计算,确保无论如何或在何等位置计算,计算结果都一致、可靠。例如,对于“招聘成本”这一度量,数据模型将正确映射适用的源系统并集中定义度量计算,随后所有调用该度量的可视化视图或报告流程都将始终报告相同的数据。

经治理的语义模型

您可以开发和交付可信赖且经治理的语义模型,获得一致的关键业务数据视图。同时,您还可以将复杂数据映射到熟悉且一致的业务条规,设计和执行经过优化的查询。

语义模型分为三层:从物理层开始,然后依次馈送给物理层和表示层。物理层旨在映射组织的物理数据源系统,通常由 IT 人员配置和管理。逻辑层适用于构建业务计算、层级结构和将多个数据源映射到逻辑报告区域。例如,ERP 系统和数据仓库可一同映射到财务报告区域。表示层则决定了如何向用户提供属性和度量,帮助用户创建分析案例。虽然所有数据都是一致计算的,用户数据视图可根据用户安全访问权限和授权情况进行筛选。

图 1:在语义建模工具中查看数据沿袭

语义模型还可以作为一个 JDBC 源供第三方可视化工具(例如 Tableau、Power BI 或自定义应用)使用。这将确保即使某些业务小组选择了其他可视化工具,企业也只需定义一次度量就能跨所有报告平台保持一致。

详细了解语义层


自助数据建模

您可以自助、直接将两个或更多的表连接起来,控制表之间的关系(例如内联接或外联接),轻松与同事共享自助数据模型。

观看多表数据集演示 (2:57)


图 2:自助数据建模

详细了解自助数据建模

数据增强和推荐

您可以通过更多数据、属性或转换操作来增强数据集。内置参考知识库包括:

  • 全球定位系统扩充:
    参考城市经纬度或邮政编码进行扩充。
  • 基于参考信息的扩充:
    在性别决策中使用人名属性来指定性别。
  • 列级联:
    将人名和姓氏链接到一个列中。
  • 部分提取:
    将地址中的门牌号与街道名称分开。
  • 语义提取:
    从识别的语义类型中提取信息,例如电子邮件地址中的域。
  • 日期部分提取:
    从使用月/日/年(或日/月/年)格式的日期中提取星期数值,使可视化视图中的数据更实用。
  • 完全和部分混淆:
    屏蔽检测到的敏感字段,如信用卡或社会安全号。
  • 通用建议:
    删除含有(检测到的)敏感字段的列。
  • 自定义知识扩充:
    利用管理员添加到 Oracle Analytics 的自定义包含项进行扩充。

图 3:配置自定义参考知识库

语义建模器标记语言 (SMML)

数据模型开发人员可以使用基于 Web 的图形工具构建、编辑和优化语义模型;或使用语义建模器标记语言 (SMML),以编程方式修改模型。SMML 是一种基于 JSON 的,旨用于描述设计时语义模型的对象的标记语言。每个 SMML 文件均代表语义模型中的一个对象,支持元数据迁移、可编程元数据生成和处理、元数据打补丁等操作。开发人员可以直接编辑语义模型代码,或者通过其他编程流程更改 SMML 定义文本并应用更改。


图 4:基于 JSON 的语义建模器标记语言 (SMML)

多用户模型开发和 Git 集成

语义建模器可与 GitHub、GitLab 或 Git on Oracle Visual Builder 等所有兼容 Git 的信息库集成,提供无缝、协作式的多用户开发环境和源控制。面向多用户开发环境的 Git 集成支持分支、合并、提取和推送操作,能够跨语义模型的整个开发生命周期提供全面的可见性。


图 5:使用 Git 集成进行多用户开发

 

注:为免疑义,本网页所用以下术语专指以下含义:

  1. Oracle专指Oracle境外公司而非甲骨文中国。
  2. 相关Cloud或云术语均指代Oracle境外公司提供的云技术或其解决方案。