什么是数据集市?

数据集市的定义

数据集市是一种简单的数据仓库,专注于单个主题或业务线。借助数据集市,团队可以更快地访问数据并获取洞察,而不必花时间在更复杂的数据仓库中搜索或从不同的源手动汇总数据。

为什么要创建数据集市?

数据集市可让您更轻松地访问组织内特定团队或业务线所需的数据。例如,如果您的营销团队需要数据来帮助改善假日季的营销活动绩效,筛选和组合分散在多个系统中的数据在时间、准确性和金钱上将涉及昂贵的成本。

团队被迫从各种来源查找数据,通常依赖电子表格来共享这些数据并开展协作。这通常会导致人为错误、混淆、复杂对账以及多个事实来源 — 就是所谓的“电子表格噩梦”。数据集市已成为创建报表、仪表盘和可视化之前,收集和组织必要数据的集中平台。

数据集市、数据湖和数据仓库之间的区别

数据集市、数据湖和数据仓库满足不同的目的和需求。

数据仓库是一种数据管理系统,旨在为整个组织的商务智能和分析提供支持。数据仓库通常包含大量数据,包括历史数据。数据仓库中的数据一般来自应用日志文件和事务应用等广泛来源。数据仓库存储结构化数据,其用途通常已明确定义。

数据湖让组织存储大量结构化和非结构化数据(例如,来自社交媒体或点击流数据),并立即使其可用于实时分析、数据科学和机器学习用例。借助数据湖,无需进行更改,数据以原始形式摄取。

数据湖和数据仓库之间的主要区别在于,前者在没有预定义结构的情况下存储大量原始数据。组织不需要提前知道数据的用途。

数据集市是一种简单的数据仓库形式,侧重于单个主题或业务线,例如销售、财务或营销。由于用途单一,数据集市从比数据仓库更少的来源中获取数据。 数据集市源可以包括内部操作系统、中央数据仓库和外部数据。数据集市源可以包括内部操作系统、中央数据仓库和外部数据。

数据集市的优势

专用于团队或特定业务线的数据集市具有以下优势:

  • 单一可信数据源。数据集市的集中性有助于确保部门或组织中的每个人都根据相同的数据做出决策。这是一项重大好处,因为数据和基于该数据的预测是可信的,利益相关方可专注于作出决策并采取相应行动,而不是论证数据本身
  • 更快地访问数据。特定业务团队和用户可以从企业的数据仓库快速访问所需数据的子集,并将其与来自其他各种来源的数据相结合。一旦建立了与所需数据源的连接,他们就可以按需从数据集市获得实时数据,而无需转到 IT 即可获取定期提取。因此,业务和 IT 团队都提高了工作效率
  • 更快获得深入洞见以加速决策。数据仓库支持企业级决策,数据集市则支持部门级的数据分析。分析人员可专注于财务和人力资源等领域的特定挑战和机遇,并更快地将数据转化为洞察,从而作出更出色、更快速的决策
  • 实施变得更简单、更快捷。设置企业数据仓库以满足整个组织的需求可能需要大量时间和精力。相比之下,数据集市专注于满足特定业务团队的需求,需要访问的数据集更少。因此,实施起来更加简单快捷
  • 实现敏捷、可扩展的数据管理。数据集市提供可满足业务需求的敏捷数据管理系统,包括使用过去项目中收集的信息来帮助处理当前任务。团队可以根据全新和不断发展的分析项目,更新和更改数据集市
  • 瞬态分析。某些数据分析项目是短期的,例如,在团队会议之前针对为期两周的促销活动在线销售完成具体分析。团队可以快速设置数据集市来完成此类项目

将数据集市迁移至云端

业务团队正在努力提高敏捷性和数据驱动性,以指导战略并改善日常决策,但通常难以将不断增长的海量数据转化为洞察。首席财务官每天平均花费 2.24 小时在电子表格上。尽管业务团队通常求助于 IT 人员,IT 团队可能难以满足业务用户对更多不同数据源的访问、更大的数据量和更快查询时间的需求。

对于工作量过重的 IT 团队而言,设置数据集市也可能是一个问题,因为他们需要持续管理这些数据集市并确保数据安全。将数据集市迁移到云端有助于缓解业务和 IT 团队的顾虑,因为这就将管理和安全任务转移给了云技术服务提供商,从而减少手动干预的需求并降低运营成本。

Oracle Autonomous Database 如何为云端数据集市提供助力

Oracle 提供了完整的自助解决方案,帮助业务团队获取快速做出决策所需的深度、可靠、数据驱动的洞察。

业务团队可以将不同来源和格式的所有必要数据,包括空间和图形快速整合到一个融合数据库中,围绕数据集市提供的单一可信数据源推动安全协作。分析人员可以轻松利用自助数据工具和嵌入式机器学习(无需编码)来加快数据加载、转换和准备、自动查找模式和趋势、进行预测,并根据透明的数据来历追溯获得洞察。

Oracle 解决方案受控且安全,这让 IT 部门得以降低风险。IT 团队可以通过简单、可靠、可重复的方法来满足业务部门的全部数据分析要求,从而大大提高生产力。

面向分析和数据仓库的 Oracle Autonomous Database 可自动、智能地执行供应、配置、保护、调优、扩展、修补、备份和修复。几乎消除了所有可能导致人为错误的手动和复杂任务。内置数据工具为数据集市实现简单的自助数据加载、数据转换、业务建模和自动洞察。DBA 可以将工作重点从常规数据库管理转移到新的应用程序设计上,帮助业务部门实现目标。财务、人力资源和营销部门的业务用户可以获得安全的数据访问权限,并为任意数量的并发用户提供始终如一的高查询性能,即使在高峰时间也是如此。Oracle Autonomous Database 可根据工作负载需求自动扩展,无需停机。

注:为免疑义,本网页所用以下术语专指以下含义:

  1. Oracle专指Oracle境外公司而非甲骨文中国。
  2. 相关Cloud或云术语均指代Oracle境外公司提供的云技术或其解决方案。